メタ、4000以上の音声言語を識別できる大規模多言語音声 (MMS)モデルを発表
ASCII.jp / 2023年5月23日 16時0分
メタは5月22日、複数の音声言語を識別可能な大規模多言語音声 (MMS) モデルを発表した。
同モデルはこれまでの同種の技術の40倍となる、4000以上の音声言語の識別に対応。テキストの読み上げや音声からテキストへの変換も、1100以上の言語で利用可能だ。
開発にあたっては、多数の言語に翻訳されている聖書などの宗教書が活用されている。
同社は1100以上の言語で新約聖書の朗読データセットを作成することで、1言語あたり平均32時間分のデータを取得。さらにキリスト教の他の宗教朗読データなども活用することで、対応言語を4000以上に拡大した。
男性の朗読データが多かったが、完成したMMSは、男性の声でも女性の声でも同等に反応するという。
モデルとコードはオープンソースで提供される。
メタは将来的な課題として、既存の技術では処理が難しい方言にも挑戦していきたいとしている。
この記事に関連するニュース
-
MODEのAIアシスタント「BizStack Assistant」、GPT-4oに対応
マイナビニュース / 2024年7月3日 9時49分
-
スマホ上でも高速動作可能な21言語の高品質ニューラル音声合成技術を開発
共同通信PRワイヤー / 2024年6月25日 14時0分
-
国際会議や多言語教育、グローバルコミュニケーションに最適!Nottaから画期的な「二言語同時翻訳」新機能が登場!
PR TIMES / 2024年6月19日 17時40分
-
CoeFont、日本語収録した音声を多言語のAI音声に変換できる「Cross-Language TTS」を無料で一般公開
PR TIMES / 2024年6月13日 12時45分
-
EQ特化型LLM開発のAIスタートアップ「Spiral.AI」、誰でも簡単にAIキャラクターを作成できる「TwinRoom」を提供開始
PR TIMES / 2024年6月10日 16時15分
ランキング
-
1「赤ちゃんのお世話がしたいニャ!」ベビーサークル越しに愛を訴える猫ちゃん
おたくま経済新聞 / 2024年7月8日 7時0分
-
2「どう見てもセガのアレ」 コンビニうどんの容器トレーが「圧倒的既視感」「コントローラーの抜け殻」と話題
ねとらぼ / 2024年7月7日 17時0分
-
3モトローラが日本市場で急成長している理由 1年で出荷台数2倍以上、「edge」「razr」の販路拡大がカギに
ITmedia Mobile / 2024年7月6日 11時45分
-
4一度植えたら、自動で増殖&毎年収穫を目指せる野菜5種とは? 自然農のエキスパートが伝授する方法に反響
ねとらぼ / 2024年7月8日 9時0分
-
5「わろてる」 人気VTuberが部屋で“でかめのやらかし”をした様子を公開し話題に 「どうなってんのこれw」「想像以上」
ねとらぼ / 2024年7月7日 18時0分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)