メタ、4000以上の音声言語を識別できる大規模多言語音声 (MMS)モデルを発表
ASCII.jp / 2023年5月23日 16時0分
メタは5月22日、複数の音声言語を識別可能な大規模多言語音声 (MMS) モデルを発表した。
同モデルはこれまでの同種の技術の40倍となる、4000以上の音声言語の識別に対応。テキストの読み上げや音声からテキストへの変換も、1100以上の言語で利用可能だ。
開発にあたっては、多数の言語に翻訳されている聖書などの宗教書が活用されている。
同社は1100以上の言語で新約聖書の朗読データセットを作成することで、1言語あたり平均32時間分のデータを取得。さらにキリスト教の他の宗教朗読データなども活用することで、対応言語を4000以上に拡大した。
男性の朗読データが多かったが、完成したMMSは、男性の声でも女性の声でも同等に反応するという。
モデルとコードはオープンソースで提供される。
メタは将来的な課題として、既存の技術では処理が難しい方言にも挑戦していきたいとしている。
この記事に関連するニュース
-
八楽株式会社、「LANGUAGE INTELLIGENCE 2024」でクリエイティブコンテンツにおけるヤラクゼンの活用事例を発表
PR TIMES / 2024年11月22日 14時45分
-
ユビタス、NVIDIA AI Summit Japan 2024で革新的な次世代AIソリューションを発表
@Press / 2024年11月12日 9時30分
-
アドバンスト・メディア×DATTARUJIN AI音声対話アバター「AI Avatar AOI」のシステムを活用した、横浜・みなとみらいのご当地AIキャラクター「湊くるみ」開発事業が始動
PR TIMES / 2024年11月7日 13時15分
-
国内生成AI開発プロジェクト「GENIAC」の第2期に採択されたコトバテクノロジーズ、最先端の日本語音声生成モデルのプレイグランド、「Kotoba SpeechGen」β版をリリース
PR TIMES / 2024年10月29日 10時45分
-
【Voice Space活用事例紹介】東京ガスエンジニアリングソリューションズ株式会社様が音声AIサービスのVoice Spaceを導入
PR TIMES / 2024年10月28日 11時15分
ランキング
-
1HD-2D版『ドラクエ3』勇者「俺だけバラモス倒せなかった…」←なんで? 嘆きの声続出の理由
マグミクス / 2024年11月25日 17時25分
-
2ビューカード、顧客との通話内容を録音したSDカード20枚を紛失
ASCII.jp / 2024年11月25日 17時5分
-
3メルカリ、不正利用へのサポート強化と補償方針を発表 ネットで意見「当たり前」「個人的には期待」「悪意のあるやつは排除して」
iza(イザ!) / 2024年11月25日 13時21分
-
4スタバ福袋当選発表に悲喜こもごも SNS「3度目の正直来た」「外れてうつになりそう」
iza(イザ!) / 2024年11月25日 12時11分
-
5「不要なスマホなどをdポイントと交換」 ドコモ、小型機器の買い取りに挑戦 都内の25店舗で
ITmedia Mobile / 2024年11月25日 16時21分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください