生身の人間の声を採用したTTSツール「Listnr」、自分の声のクローン生成も可能
Techable / 2024年3月9日 18時0分
入力した文字や文章を即座に音声に変換するAIツール、TTS。「TTS」は「Text‐To‐Speech」の略で、日本語では「読み上げ音声AI」や「テキスト読み上げ音声合成ツール」などと呼ばれる。
グローバル化に伴いニーズの高まる多言語通訳や、障がい者のコミュニケーションツールとしての役割が期待される技術で、DATA Bridge Market Researchによると世界のTTS市場は2029年までに$170億ドル(約2.2兆円)規模に成長するとの見通しだ。
2024年3月時点ですでに数多くのTTSツールがオンラインで利用可能だが、「Listnr」はカスタマイズ性の高さと使いやすさが特徴。142か国語に対応し1000種類以上の音声タイプから選択可能で、自分の声のクローンも生成でき、TikToksやYoutube、PodcastsへのAPI機能も充実している。
シンプルで使いやすいAI音声、リアルな人間の声が1000種類以上Listnerが他のTTSツールと異なるのは、実在する人間の声が採用されている点だ。すべての声には提供者がいて、声の所有権は提供者に属している。
各自が自分の声をListnrに登録するシステムで、登録済みの音声は142か国語1000種類以上に及ぶ。豊富な言語・声の種類からユーザーの目的やイメージに合ったものが選べるようになっているのだ。
実際のツールを使わなくても、公式サイト上でListnrの機能の一部を試すことができる。140字までテキストを入力でき、言語やボイスの選択、音声生成、生成音声のダウンロードまで可能。実際に日本語音声を入力すると下の画像のようになる。
サイト上では140字までだが、メールアドレスの登録またはGoogleアカウントでListnrにログインすれば1000単語/月の無料プランを利用できる。使い方はじつにシンプル。音声にしたい文章を画面に入力して、希望する音声のイメージを設定するだけだ。後は本物の人間が読み上げたようにナチュラルな音声をAIが生成してくれる。
女性や男性でフィルタをかけたり、一覧にある「John」、「Paul」といった名前から探せる。「Alloy(合金)」、「Echo(エコー)」、「Fable(寓話)」、「Onyx(オニキス)」のように声のニュアンスも選べるので、求めるイメージに近い音声を見つけやすい。
また、TTSエディター画面では「Speed」のスライドバーで読み上げ速度を自由に変更したり、「間」の追加、ピッチや発音の変更、完成した音声の保存・エキスポートなどを行うことができる。
有料プランは1~99ドルの4種類があり、いずれも1000単語/月までは無料で使用可能。金額に比例して利用できる機能や使用可能な単語数も多くなる。例えば、実際にマルチリンガルである人物の音声を選択して、多国籍な発音を再現することもできる。設定できるキャラクターの選択肢も増え、よりイメージに近い音声でナレーションやコミュニケーションの質を高めていけそうだ。
他に、画像や文章のURLを添付するだけで音声に変換できるボイスオーバー(自動通訳&音声)機能も。現時点ではYoutube、TickTock、Podcastと連携済みで、APIで簡単に接続できる。
インドからカナダに移住した青年が学生時代の貯金を元手に開発複数のスタートアップ紹介サイトによると、Listnrの設立者兼CEOのAnanay Batra氏はインド出身。彼の教育のために家族でカナダに移住し、トロントのヨーク大学で理学士号を取得、コンピューターサイエンスも修めた人物とのことだ。
起業のきっかけは、Batra氏が2020年にポッドキャストを始めようとしたことだった。ポッドキャストの制作ワークフローを容易にするソリューションが存在しないことに気づいたのだ。そして、録音・編集・ホスト・配信・マネタイズの5工程すべてをワンストップで実行できるソリューションの構築を目指すことに。
しかし、当時大学を出たばかりのBatra氏にはSaaSアプリを構築するコーディングスキルも資金もなかった。仕方なく、学生時代にアルバイトやインターンで作った貯金を使って人材を採用。数ヵ月かけて20人以上の学生にあたった末に、ようやくBatra氏を含めて3人のチームが発足した。誰もSaaS構築の経験はなかったが、何とか3か月ほどでプロトタイプを完成させたのだ。
2020年9月にローンチしたが、初めはバグだらけでユーザーの評価も星1など散々なありさまで、全員が数日徹夜で修正にあたった。その後も修正とローンチを何度も繰り返してListnr V1は何とか動作する製品となった。
今ではListnrは業界でも注目される存在だ。AIでプロ並みの動画を制作するSynthesia社が2月29日に公開したばかりの記事「AI生成音声ベスト13」では3位に選ばれている。また、Batra氏は今年1月、Xにて「Honda AustraliaがListnrのクライアントになった」と発表。「今後も大企業が続々顧客リストに加わる予定」としている。
カスタマーサービス、商品紹介、プレゼンテーション、ナレーションにナビゲーション、アニメやゲームなどTTSの用途は幅広い。医療や教育分野でのコミュニケーションツールとしても注目されている。ぎこちないデジタル音声は過去のものとなり、Listnrのツールでより自然な生成音声の普及が期待できそうだ。
引用元:Listnr サービスサイト
Listnr企業サイト
(文・Takasugi)
外部リンク
この記事に関連するニュース
-
【Voice Space活用事例紹介】展示会の製品紹介動画ナレーションでテキスト読み上げ・多言語翻訳を活用(株式会社ソディック様)
PR TIMES / 2024年11月21日 17時40分
-
エンタメ大国・韓国発AIオーディオ企業「Supertone」の実力 日本市場をいかにして攻略するか?
ITmedia ビジネスオンライン / 2024年11月9日 17時48分
-
【東芝デジタルソリューションズ】RECAIUS音声合成ミドルウェア「ToSpeak」のハイエンド機器向けラインアップを強化
Digital PR Platform / 2024年11月6日 11時27分
-
AI音声読み上げサービス「Sonicbowl SPEECH」を提供開始
PR TIMES / 2024年11月6日 10時0分
-
【画像から動画生成するAI】無料・高画質・簡単!『Vidnoz』の画像から動画生成AIツールで、手軽に映像制作が可能に!
PR TIMES / 2024年10月28日 18時15分
ランキング
-
1【最新】Wi-Fiルーターだけはいいものを買え、今ならこれでキマリだ
ASCII.jp / 2024年11月23日 17時0分
-
2Switchで遊べるヴァンサバ系ゲーム5選!強化しまくって大量の敵を一掃する「俺TUEEE!」が超気持ちいい
インサイド / 2024年11月23日 15時0分
-
3普段は塩対応の柴犬に大好きな人が会いに来たら……? 別犬のような喜び方が270万再生を突破「お散歩ってワードにも、それで頼む」
ねとらぼ / 2024年11月23日 7時0分
-
4プロが教える「PCをオフにする時はシャットダウンとスリープ、どっちがいいの?」 理想の選択肢は意外にも…… 「有益な情報ありがとう」「感動しました
ねとらぼ / 2024年11月20日 22時0分
-
5「しぬwww」「怖すぎ」 かわいいカメを“絵文字ミックス”したら…… 爆誕した“バケモノ”が2200万表示 衝撃ビジュアルに「笑いすぎて涙」
ねとらぼ / 2024年11月23日 20時20分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください