Infoseek 楽天

ローカル/クラウドを問わずテキスト起こしや議事録作成などの手間をAIなどで解決! アドバンスト・メディアが「VoXT One」プラットフォームを提供するワケ

ITmedia PC USER 2024年9月4日 21時0分

 アドバンスト・メディアは9月4日、同社が提供する複数の議事録作成サポートツールを1つのアカウントで利用できる新サービス「VoXT One」(ボクストワン)を9日に公開すると発表した。それぞれのツール間でデータがスムーズに連携できるようになる他、新たな編集ツールなどの提供も始める。

 東京都豊島区にある本社カフェスペースで開かれた発表会では、新プラットフォームを紹介する同社 VoXT事業部 志村亮一氏の発言をバックグラウンドでテキスト化し、生成AIにより要約するというデモンストレーションも行われた。

●1つのアカウントでローカルもクラウドも

 アドバンスト・メディアでは、スタンドアロン型(ローカル型)AI音声認識文字起こし支援アプリケーション「ScribeAssist」(スクライブアシスト)と、クラウド型文字起こしサービス「ProVoXT」(プロボクスト)を提供してきた。

 それぞれにメリット/デメリットがあり、「スタンドアロン型では情報の漏えいリスクが低く、セキュリティ面で安心というメリットがある反面、デバイスに依存することやアップデートが面倒だというデメリットがある。クラウド型であれば、どのデバイスからでもアクセスできる柔軟性がある反面、セキュリティリスクが存在し、インターネット接続が可能な環境でないと使えないというデメリットがあった」と志村氏。「片方のメリットが他方にとってデメリットになるという具合だ」と解説した。

 同じ企業、同じユーザーであっても、経営会議や取締役会などでは、よりセキュアにデータ化したいというニーズからスタンドアロン型のScribeAssistが好まれる一方で、商談や一般的な会議などでは共有しやすいクラウド型のProVoXTが利用される場合が多いという。

 そのようなニーズから、ScribeAssistもProVoXTも1つのアカウントで使える「VoXT One」プラットフォームを展開することになった。これにより、サービス提供側も共通化による開発スピードのアップ、幅広い顧客層へのアプローチといったメリットを享受できる。

 スタンドアロン型ScribeAssistでは、ライセンスごとに料金が発生する。ライセンスでのインストール端末台数の制限はないが、同時利用台数は限定される。音声をリアルタイム認識してテキスト化する。字幕表示や単語登録なども可能だ。

 一方のクラウド型ProVoXTでは、利用量に応じた支払いが発生する。対応言語は日本語のみとなる。

 どちらにも共通するのは、録音済み音声ファイルをテキスト化すること、AI要約を使えること、話者識別できることだ。スタンドアロン型であれクラウド型であれ、どちらを使ってもほぼ同じ結果を得られるものの、リアルタイムで音声からテキスト化するか、録音したものをテキスト化するかという処理の流れの部分が異なる。

●ChatGPTを活用したAI要約機能

 ScribeAssistは2023年に「GPT-3.0」(後に3.5)を活用した「AI要約機能」(β版)を搭載しているが、今回のVoXT Oneを提供するにあたり、LLMを最新の「GPT-4o」にアップデートして正式版としている。

 ScribeAssistでのAI要約方法は2種類ある。1つはScribeAssist内で要約する方法だ。「ScribeAssistで要約」ボタンを押せば、アジェンダリストと、各アジェンダの下に概要や決定事項、ネクストアクションがテキストから生成される。

 もう1つの方法は、ProVoXTで要約することだ。これは同ツールに新たに搭載された「議事録エディタ」機能を用いたもので、議題ごとに要点をまとめる「要点まとめ」や、議題ごとに概要/決定/ネクストアクションを出力する「議事録」という2つの出力方式を選べる。

 要約方法も「すべてAIにまかせる」と「自分で設定した議題ごとに要約する(ファシリテーションモード)」から選べ、必要な内容を全て網羅したかどうかのセルフチェックも行いやすいという。

 ここまでVoXT Oneの解説をしてきた志村氏は、スライド資料からScribeAssistにウィンドウを切り替えて、話した内容がテキスト起こしされていることをアピールした。

 その後、上記で説明したように、まずはScribeAssist、次いでProVoXTでテキストから議事録を作成した。

 ScribeAssistでの議事録作成は、ローカルで処理しているということもあり、1~2分ほどで完成した。他方、ProVoXTでは体感的に2~3分ほどかかった。1時間分の内容を要約するのに5分かかるということなので、想定通りの時間で要約できたというところだろう。

 いずれにせよ会議後、自席につくまでの間に議事録が完成しているという状況を作り出せるので、議事録作成担当者の負担は軽減されるし、発言者たちはすぐに振り返りができ、次の会議の質を上げやすくなるに違いない。

●地方自治体や民間企業/団体との取り組みも

 現在、AmiVoiceエンジンを使った書き起こしツールを全国810以上の地方自治体に加え、1660以上の民間企業や団体が導入しているという。

 また、地方自治体との実証実験も進んでいる。茨城県取手市では、会議の全文議事録データから、市民に分かりやすく会議の内容を伝える「議会だより」を作成する取り組みを行っている。質問者の議員名をクリックすると、その議員が行った質問の要約と、それに対する答弁の要約が表示されるというソリューションを同社が提供しており、これにより早く正確な議会だよりを作成することが可能になった。

 その他、受け取った質問通告から想定される質問を作成し、それに対する答弁書の作成でも、同社の生成AIが利用されている。

 各種計画や資料などの情報を反映するだけでなく、過去の答弁で似たようなものがなかったか、あればどのように活用できるか、また他の地方自治体で同様の質問にどのような答弁がなされたかなどを検索し、答弁書に反映していく。これにより、迅速な答弁書作成が可能になっている。

この記事の関連ニュース