1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

mocomoco、高性能音声認識AI「mocoVoice API」提供開始!

PR TIMES / 2024年11月30日 15時15分



[画像1: https://prcdn.freetls.fastly.net/release_image/146901/1/146901-1-591fd825d4cd454de915ba16abebc907-882x666.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


mocomoco株式会社は、音声認識クラウドサービス「mocoVoice API」を正式にリリースいたします。本サービスは、個人向けおよび企業向けにAPIを提供し、次世代の音声認識技術を駆使して、精度と速度の両面でこれまでにない体験を提供します。
<mocoVoiceの機能>
mocoVoiceでは、音声から書き起こしが可能です。音声の書き起こし機能を提供するだけでなく、以下のような機能も備えています。

辞書機能によるドメイン特化
特定の業界や専門分野に合わせて辞書単語を登録し、精度を向上させます。
例:「マイナ保険証」のような、業界用語を辞書に登録することで精確に書き起こしできます。


- “読み”なしの辞書登録
読みの指定が不要な辞書機能を備えています。
例:「マイナ保険証」を辞書単語に登録する際、読み「まいなほけんしょう」の追加が不要です。



- 非常に高速な推論
1時間の音声を最速3分で書き起こすことができます。



- ChatGPTによる高速な文章校正
音声認識後のテキストを自動で校正し、質の高い文章を提供します。



- 音声と動画の入力
音声データに加えて、動画データからも音声認識が可能です。


<対象ユーザー>
mocoVoice APIは、個人ユーザーから企業ユーザーまで利用できます。幅広いニーズに対応するために、複数のプランを提供しています。

<料金プラン(※1)>
mocoVoice APIの料金プランは学習なしプランと学習ありプランから選べます。
学習なしプラン
お客様のデータはサービス改善に利用されません。プライバシー保護を重視されるお客様におすすめです。

[表1: https://prtimes.jp/data/corp/146901/table/1_1_c57baf3123aa306578536863db4f0eb9.jpg ]
学習ありプラン
お客様のデータは匿名化された上で、mocoVoiceのサービス改善や精度向上に利用させていただきます。
[表2: https://prtimes.jp/data/corp/146901/table/1_2_d950f3b7883d9f5e715adacde194e104.jpg ]

全てのプランには、校正機能が含まれています。

<サービス利用のお申込みはこちら>
mocoVoice APIの利用を開始するには、こちらのGoogle Form からmocoVoice APIの利用申請をお申し込みください。アカウント作成後、すぐに音声認識機能をお試しいただけます。

<導入実績>
すでに導入いただいている企業では、金融ドメインに特化した議事録サービスで利用されており、会議の効率化や情報共有の迅速化に寄与しています。また、金融業界特有の専門用語や略語にも対応しており、正確な議事録作成を実現しています。

<開発背景>
現在、一般的な音声認識サービスは、医療や金融などで使用される専門用語に対応が難しいとされています。また、競合他社のサービスでも、日本語と英語が混在する音声には対応できないなどの課題があります。さらに、音声認識に時間がかかり、コストが高い点も問題視されています。これらの問題を解決するため、mocoVoiceを開発しました。


<技術的な特徴>
mocoVoiceは、音声認識業界の最高性能を誇るOpenAI Whisperをベースにし、mocomoco独自の辞書アルゴリズムと高速化技術を兼ね備えています。 mocoVoiceの辞書アルゴリズムは、特定の単語のよみがなくても、認識精度の向上が可能となっています。 mocoVoiceの高速化技術により、OpenAI Whisper(※2)よりも高速な音声認識を実現しています。
文章校正にはChatGPTを利用し、読みと音声が異なる単語も正確に反映する工夫をしています。

<サポート・運用体制>
mocoVoice APIはドキュメントページ( https://docs.mocomoco.ai/ )を用意しております。導入しやすいサンプルプログラムに加え、技術サポートも受け付けています。
利用料金やチーム、APIキーの管理が可能なダッシュボードページを用意しています。
[画像2: https://prcdn.freetls.fastly.net/release_image/146901/1/146901-1-f28321afe5c93c96d239b72e41e8b4d4-1384x646.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
mocoVoice API ドキュメントページ


[画像3: https://prcdn.freetls.fastly.net/release_image/146901/1/146901-1-f532c193a65fd10036ea9dde18b516bd-1216x764.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
mocoVoice API ダッシュボードページ

<今後の展望>
mocoVoice APIは近日中に多言語対応、話者分離機能の追加を予定しております。また、mocoVoiceが簡易的に試せるmocoVoice Playgroundページの提供も順次開始予定です。

mocomoco株式会社は、高性能音声認識AI「mocoVoice 」を皮切りに、ユーザのニーズに寄り添った、さらに便利なAIサービス展開を予定しています。

関連ページ
mocoVoice API 利用申請フォーム
https://forms.gle/YU2a4aeHgwtF8E8L7

mocoVoice API ドキュメントページ
https://docs.mocomoco.ai/

mocomoco株式会社 HP
https://www.mocomoco.ai/

mocomoco株式会社 会社概要
[画像4: https://prcdn.freetls.fastly.net/release_image/146901/1/146901-1-f84caffa5e4cd287a93bb280ee88850c-3900x1096.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

代表者:代表取締役CEO 田中康紀
本社:〒150-0043 東京都渋谷区道玄坂1丁目10番8号渋谷道玄坂東急ビル2F−C
HP:https://mocomoco.ai
広報担当 メール: contact@mocomoco.ai





※1 上記料金は2024年11月28日時点のものです。最新の料金については、公式サイトをご確認ください。
※2 比較対象はtransformers版 openai/whisper-large-v3です。

企業プレスリリース詳細へ
PR TIMESトップへ

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください