1. トップ
  2. 新着ニュース
  3. 経済
  4. ビジネス

エンタメ大国・韓国発AIオーディオ企業「Supertone」の実力 日本市場をいかにして攻略するか?

ITmedia ビジネスオンライン / 2024年11月9日 17時48分

 後者のPlayは、打ち込んだテキスト文章を、選択したキャラクターの声で読み上げることができる。Shiftと同様、音声の高さや抑揚などを調整できる上、英語や日本語など複数の言語で生成できるという。

 デモをしてくれた担当者によると、現時点では、特に英語と韓国語に関して、かなり高い精度を誇っているという。今後は日本語の精度をさらに上げるとともに対応言語を増やし続け、よりグローバルなサービスを提供したいと話していた。対応言語が将来5、10、15と増えていけば利便性はより高まる。

●コンテンツが豊富な日本 Supertoneの技術との相性は?

 PlayとShiftを開発した動機をKyosun氏に聞くと「私たちが開発しているのは、音声を専門にした独自の基盤モデルで、他社が開発した技術を持ってきて何かを作っているわけではありません。弊社は基本的に音楽やゲームなどコンテンツが好きな人たちの集まりで、開発した技術をコンテンツに応用したいと思ってきました」と明かす。PlayやShiftの本格的な開発は、2023年に始まった。

 「今のコンテンツ業界のトレンドを見ると、バーチャルヒューマンやメタバースなど、声が必要となる分野がホットだからです。日本市場ではVTuberの人気が高い一方、地声を公開したくない人も少なくありません。そういう意味で、Shiftは特に日本市場に受け入れられやすい技術だと確信しています。日本にはコンテンツが豊富にそろっているので、私たちの技術を提供できる機会も多く、その強みをアピールできると思っています」

 音声を、任意の音声にすぐに変換して出力するリアルタイムボイスチェンジャー(RVC)は、以前から日本でも多くの競合がサービスを提供している。Shiftの強みは何かと聞くと「RVCは昔から存在し、質の違いがあるだけで、競合他社が多いのは事実です。ただし、Shiftの質は非常に高いのです。競争力は高いと自負しており、他社との差は確実にあると考えています」と話し、技術力に自信を見せた。

 自信の源泉は4つあり、同社が「学者の集まり」であることから論文も発表。音声分野で最も権威のある国際会議「INTERSPEECH」でも発表したという。

 「1つ目は、競合他社と比べてもかなり遅延が少ない点です。2つ目は、変換された後の音声が非常に自然な声であることです。3つ目は、元となる音声データを学習させる必要があるものの、標準で20秒ぐらいの音声サンプルで実装可能な点です。最後は、同時にいろんなアプリケーションを実行しても問題ないほどデータ容量が軽い点です」

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください