1. トップ
  2. 新着ニュース
  3. 経済
  4. ビジネス

最強の「自動文字起こし」ツールはコレだ! ベテラン編集者が全力で推す3選

集英社オンライン / 2022年10月12日 15時1分

会議や打ち合わせなどの音声を文字に起こしたいとき、頼りになるのが「自動文字起こしツール」だ。ここでは編集者歴20年を超える筆者が、特におすすめしたい注目ツールを3本に厳選。それぞれの実力を紹介する。

徹夜での文字起こしにオサラバ

「文字起こし」や「テープ起こし」と呼ばれる作業には、これまで多くの人が手を焼いてきた。音声データの再生と巻き戻しをちょこまかと繰り返しながら、内容をちょっとずつ文字に起こしていく……。わずか30分の会話でも、正確に書き起こそうとすれば何時間もかかってしまうのが当たり前だった。

しかし、今はAI(人工知能)が人に変わって文字起こしをしてくれるようになった。変換精度も思いのほか高く、出来上がった文章をザッと眺めるだけで、会話の内容を把握できることも多い。徹夜で文字起こしをする日々とはオサラバできるようになったのだ。



ただし、現在は実に数多くの文字起こしツール/サービスが存在しており、どれを選んでいいか判断が難しい。

そこで本稿では、数々の文字起こしツールを使い倒してきた筆者が本当におすすめしたいツールをピックアップ。ツールのキモである変換精度に加え、使い勝手や機能性、料金体系、対応デバイスなど多角的に検討したところ、3つのツールに絞り込むことができた。まずはその顔ぶれをご紹介しよう。

●CLOVA Note

提供元:LINE株式会社
プラットフォーム:PC(WEBブラウザ)、iOS、Android
料金体系:無料
URL:https://clovanote.line.me

LINEが提供する文字起こしツール。利用にはLINEアカウントが必要。現在ベータサービス期間中ということで完全無料で利用でき、特に有料オプションなどは存在しない。300分/月の利用が可能だが、品質向上のためのデータ提供に同意した場合は600分/月まで拡張される。

WEBブラウザ経由で音声ファイルをアップロードして解析を行う。解析後の画面では、文字起こしされたテキストと音声プレーヤが表示され、音声を聞き直しながらテキストを再編集するといったこともできる。

また、iOS/Android向けにスマホアプリも提供されている。スマホを使って録音を行い、ダイレクトに録音データをアップロードし、文字起こしをすることが可能だ。


●Notta

提供元:Notta株式会社
プラットフォーム:PC(WEBブラウザ)、iOS、Android
料金体系:無料/プレミアム(8.25ドル/月)/チーム(18ドル/月)
URL:https://www.notta.ai

高機能な自動文字起こしツール。WEBブラウザからの利用では、音声ファイルのアップロードとリアルタイム録音が可能。さらにこのサービスでは、ZoomやGoogle Meetなどのビデオ会議を文字起こしできる「Notta Bot」という機能や、YouTubeや各種オンライン講座の文字起こしができるGoogle Chrome用の機能拡張が提供されている点もユニークだ。

月額8.25ドル(約1200円)のプレミアム版に加入すると、1カ月あたり1800分まで利用可能。ほとんどの人にとって十分な時間だろう。無料プランもあるが、利用可能時間は最長5分間/月(リアルタイム文字起こしの場合は3分)。本格的に使うにはプレミアム版の加入を検討しよう。また、複数メンバーで記録を共有できるチーム版というプランも用意されている。

●Word Online

提供元:マイクロソフト株式会社
プラットフォーム:PC(Microsoft Edge、Google Chrome)
料金体系:Microsoft 365への加入が必要。個人向けのMicrosoft 365 Personalなら1284円/月
URL:https://www.microsoft.com/ja-jp/microsoft-365

Microsoft 365はWordやExcel、PowerPointといったビジネスソフトを定額で利用できるサブスクリプションサービスだが、その中に自動文字起こし(トランスクリプト)機能が存在する。

文字起こし機能は、WEBブラウザ版の「Word Online」上で利用できる。音声ファイルをアップロードするか、あるいは直接録音を行ってもいい。なお、動作対象となるWEBブラウザはMicrosoft EdgeとGoogle Chromeのみ。MacユーザはMac版のGoogle Chromeを使ってアクセスするといいだろう。

次ページ以降では、この3つのサービスを比較しながら、それぞれのメリット・デメリットをまとめていこう。

いずれも高精度ながらサービスごとにクセがある

今回紹介している自動文字起こしツールは、いずれも変換精度が高い。記事作成にあたって、ピックアップしたもの以外にも複数のツールを検証したが、この3本は群を抜く精度だった。

下の図は、それぞれの変換結果をまとめたもの。細切れになった文を1ブロックにまとめたりといった処理は行なったが、表記や句読点の位置は変換結果のままだ。赤い部分が正しく変換されなかった箇所だが、ほとんど存在しないことに気づくだろう。

CLOVA Noteでは「リノベ」という省略した言い回しがうまく認識されなかった以外は、おおむね正確に変換された。

「CLOVA Note」の文字起こしサンプル

Nottaもかなり精度が高い。このテストでは認識してもらえない箇所が出てしまったが、Nottaは聞き取りにくい声でも拾ってくれることが多い印象だ。

「Notta」の文字起こしサンプル

Word Onlineも、やはり変換精度は十分。「リフォーム工事」という言葉が正しく認識してもらえなかったのは残念だが、十分実用できるレベルだ。

「Word Online」の文字起こしサンプル

この3つのツールの場合、話し手がハキハキとしゃべっていれば、誤認識はかなり少ない。変換後のテキストをざっと眺めるだけで、会話の内容を十分に汲み取れるレベルだ。

しかし、実際の会話は、理想的な喋り方ばかりとは限らない。語尾が小さい声になって聞き取れなかったり、言葉を言い間違えたりする。また、話が終わる前にほかの人が喋り出して、声が重なることもしばしばある。

こうした場面では、当然ながらどのツールも変換精度が落ちる。そして、この「聞き取りにくい部分をどうするか」で、各ツールの個性が出てくることに気づいた。

CLOVA Noteの場合、聞き取りにくい部分は比較的無視されやすい。元の録音状況が悪いと、ごっそりと会話が抜け落ちてしまうことがある。一方、Nottaは、聞き取りにくい音も可能な限り変換を試みる。しかし、うまく処理できずトンチンカンな変換になってしまい、それが理解を妨げる要因になることもある。

聞き取りにくい部分をもっとも高精度に変換してくれたのがWord Onlineだ。しかし、Word Onlineは「ああ」、「えええ」、「うん」など、相槌や意味のない言葉を漏れなく拾おうとするため、出来上がった文章が読みにくくなる点がネックだ。

ざっくりと内容をつかめればいいのであればCLOVA Note。なるべく抜け落ちを避けたいならNotta。読み解くのに時間がかかっても漏れのない文字起こしを望むならWord Onlineといったところだろうか。使う目的によって最適なツールは変わってきそうだ。

変換精度以外にも注目ポイントはいろいろ

自動文字起こしツールを選ぶ観点は、変換精度だけではない。続いては、それぞれのツールの長所と短所をまとめていこう。

まずCLOVA Noteは、なんといっても無料で使えるのが大きい。また、音声ファイルを読み込んだとき、解析の時間がずば抜けて速かった。さらに、声を分析して「参加者1」「参加者2」といったように切り分けを行なってくれるが、その精度も高かった。WEBブラウザ版のインターフェイスもすっきりしていて使いやすく、多くの人におすすめできるツールだ。

音声ファイルをドラッグ&ドロップでアップロード。解析の時間はかなり早く、1時間の録音データもわずか1分ほどで解析が完了した

話者ごとにアイコンがついていてわかりやすい。重要な発言に「ブックマーク」を追加すると、後で見つけやすくなる

アイコンの横に表示される話者の名前を付け替えることが可能。1カ所だけ変えれば、全体を一括置換することが可能だ

Nottaは、聞き取りにくい部分も処理を試みてくれるため、抜け落ちが少ないのがメリット。WEBブラウザ版のインターフェイスもすっきりしている。さらに、YouTubeなどの音声も翻訳できるGoogle Chrome機能拡張やビデオ会議用の文字起こしツール、外国語の翻訳機能など豊富な機能を搭載している。これらの機能に魅力を感じる人ならNottaがおすすめだ。

スッキリとしたユーザインターフェイス。NottaのWEBブラウザ版は音声ファイルの読み込みだけでなく、録音しながらリアルタイムで文字起こしを行うことも可能

ビデオ会議に録音用のBotを参加させ、自動で文字起こしをしてくれる「Notta Bot」の機能もある

Google Chromeの機能拡張。WEBブラウザ上で再生されている音声を収録し、文字起こしを行なってくれる。外国語を日本語に翻訳する機能もある(スマホアプリ上で利用可能)

Word Onlineは、文字起こし専用ツールというわけでないため、インターフェイスは少しわかりにくい。また、出来上がった文章が細切れになりやすく、内容を把握しにくい点もデメリットだ。しかし、聞き取りにくい部分の変換精度が高く、かなり頼りになる。Microsoft 365の加入が前提になるが、企業がMicrosoft 365のグループ版を導入しているなら、個人で契約しなくてもこの機能を利用できる。対象となる人は案外多いのではないだろうか。

あくまでもWordの機能の1つ。Word Online自体はMacのSafariなどでも使えるが、文字起こし機能が使えるのはMicrosoft EdgeとGoogle Chromeのみ

画面右側のパネルからファイルのアップロードを行う。少し前まで300分/月のアップロード上限があったが、本稿執筆時では無制限になっている

分析が行われた後、右側パネルの下にある「ドキュメントに追加」ボタンを押すことで文書に挿入される。文書はクラウドに保存され、後から音声を聞き直すことも可能だ

こうしたツールごとの違いを踏まえ、自分にとって一番の自動文字起こしツールを見極めてみよう。筆者の場合、インタビューの内容をざっくりと振り返るときにはCLOVA Note、対談原稿の作成のために丁寧に言葉を拾いたいときはWord Onlineを使っている。また、Google ChromeにはNottaの機能拡張をインストールして、WEB動画の全体像をサッと把握したいときに活用している。このように、目的に応じて複数のツールを使い分けるのもいいのではないだろうか。

おすすめの運用方法

最後に、文字起こしツールのワンポイントアドバイスを一つお伝えしておこう。

録音と同時にリアルタイム変換が可能なツールもあるが、それでも後で音声データをアップロードする方法のほうがおすすめだ。通信状況の悪化やサーバトラブルが原因でアップロードや変換が完了しない場合があるからだ。元の録音データがなくなってしまっては元も子もない。

録音時はあまり余計なことを考えず、確実に録音できる環境の確保に努めるのがいいだろう。

文/小平淳一

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください