今月1日にβ版を公開したAI音声生成サービス「DMMボイス」が、公開から4日間で概算700万文字の音声を生成するなどクリエイターの注目を集めている。DMMグループでAI関連サービスを開発するAlgomatic GlobalカンパニーCEOの原田祐二さん「一度に70文字までしか生成できない制限を入れているのに驚異的な数字」と自身のnoteで紹介した。
β版では、20人のキャラクターから1人を選び、70文字までのテキストを入力すると音声を合成できる。自然な話し方になるのが特長で、再生スピードの調整も可能。現在は登録不要、無料で提供している。
原田さんは、DMMボイスを使った作品を公開しているX上の投稿を紹介しながら「実際DMMボイスを触っているとわかるのですが、すごく楽しいんですよね。声がリアル過ぎて本格的な動画を簡単に作れるので、作り始めると止まらない癖になるサービスです」という。
今後の計画についても触れた。現在20種類の声(キャラクター)は、年内に少なくとも100種類まで増やす予定で、「順次新キャラクターもどんどん投下」するという。ASMRや関西弁に対応するキャラクターも用意する。
また「感情パラメーター設定」の実装や、簡易ではあるもののネイティブアプリの提供も年内を予定している。アプリは文字数の制限を外した有償プランを基本としながら、フリーのプランも残す考え。「それぞれのプランの上限文字数の範囲でAPIも使えるようにする」という。
一方、ユーザーが登録した声で音声モデルを作成する仕組みも用意する考え。ただし作成にはコストが掛かるため審査制とし、音声モデルになったユーザーには生成された文字量に応じて収益を還元するという。原田さんは、具体的な金額は公表しないものの、「初期フェーズは大きく還元していきたい」としている。