Siriを超える音声認識の世界
ニューズウィーク日本版 / 2017年10月2日 16時25分
<着実に進化する音声認識技術が私たちの生活習慣や思考回路を一変させる>
今の子供が大人になる頃には、キーボードはそろばんのような時代遅れの道具になっているだろう。そのうちに、博物館でしか見たことがないと言われるかもしれない。
私は98年にある記事で、「音声認識技術が世界を変えようとしている」と書いた。ただし、当時の最先端のソフトに「2つのターンテーブルと1つのマイクロホン」と話し掛けたら、「2つのトーン(破れた)レーベルと1つのアイスクリームコーン」と認識したのだが。
もちろん、近年の音声認識技術はもっと優秀だ。マイクロソフト、グーグル、アマゾン・ドットコム、IBM、中国の百度(バイドゥ)などのIT大手やスタートアップが、微妙な言葉遣いまで理解して論理的に返答できる人工知能(AI)システムの開発を進めている。
マイクロソフトは昨年10月、自社の音声認識システムが「人間と同じレベル」になったと発表した。単語誤り率が人間(プロの口述筆記者)と同等の5.9%まで低下したのだ。
グーグルの音声認識サービスは、世界中の言語を次々に習得している。今年8月にもアゼルバイジャン語やジャワ語など30言語が追加され、現在119言語をサポートしている。
IBMのAIプラットフォーム「ワトソン」が、ボブ・ディランと会話をするCMを見たことがある人もいるだろう。ディランの言葉を機械が理解できるなんて画期的ではないか。
急成長中の音声認識ビジネスに、多くの企業が照準を合わせている。アマゾンのAIアシスタント「アレクサ」を搭載した音声認識スピーカー「アマゾン・エコー」が普及すれば、話し掛けるだけで買い物できるのが当たり前になる。
グーグルは8月に、小売り最大手ウォルマートとのネット通販事業の提携を発表。こちらも、音声認識スピーカー「グーグル・ホーム」に話し掛けるだけで注文できるようになる。
ネット通販では、チャットボット(自動会話プログラム)のアプリが注目を集めている。現在は大半が文字入力のテキストでやりとりするが、音声入力も着実に増えている。
調査会社コムスコアによると、20年までにインターネット検索の半分が音声入力に変わるという。既に私たちの買い物の大半は、検索から始まっている。
11年にアップルの音声アシスタント「Siri(シリ)」が登場して以来、携帯電話やアプリが音声を理解するのは当然になった。音声認識技術の研究者による数十年の試行錯誤を思えば、隔世の感がある。
-
- 1
- 2
この記事に関連するニュース
-
音声生成AIを提供する東大発スタートアップ企業の株式会社IZAI(イザイ)、コールセンター向け電話応対支援ソリューションの提供を開始
PR TIMES / 2024年4月30日 11時45分
-
「ChatGPTで翻訳できるから英語の勉強は必要ない」残念な勘違いをする人が根本的に理解していない2つのこと
プレジデントオンライン / 2024年4月29日 8時15分
-
「社長室と役員室はなくしました」 価値共創領域に挑戦する日本IBM 山口社長のこだわり
ITmedia PC USER / 2024年4月24日 16時0分
-
『「超」整理法』シリーズで知られる野口悠紀雄が、シニアになったら文章は「音声入力」で書くことを薦める理由
集英社オンライン / 2024年4月16日 8時0分
-
新「Galaxy」生成AIで大きく進化した驚きの中身 インパクトが大きいのは「リアルタイム通訳」
東洋経済オンライン / 2024年4月9日 11時0分
ランキング
-
1フランス、ロシアの偽情報に危機感 マクロン大統領の部隊派遣発言後…核兵器「議論用意」
産経ニュース / 2024年5月5日 17時16分
-
2「第2、第3の制裁パネルを仕立てても死滅の運命」 北朝鮮国連大使が日米韓を牽制
産経ニュース / 2024年5月5日 15時1分
-
3要衝陥落「時間の問題」 兵器不足、交渉も視野
共同通信 / 2024年5月5日 7時43分
-
4「完全に失敗」の対ロシア制裁に、新たな手段 中国経由の抜け道封じに一定の成果、さらなる課題も
47NEWS / 2024年5月5日 10時0分
-
5台湾地震1か月、花蓮の観光客激減・夜市は閑散と…「惨たんたる状況だ」
読売新聞 / 2024年5月4日 18時34分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください