Siriを超える音声認識の世界
ニューズウィーク日本版 / 2017年10月2日 16時25分
<着実に進化する音声認識技術が私たちの生活習慣や思考回路を一変させる>
今の子供が大人になる頃には、キーボードはそろばんのような時代遅れの道具になっているだろう。そのうちに、博物館でしか見たことがないと言われるかもしれない。
私は98年にある記事で、「音声認識技術が世界を変えようとしている」と書いた。ただし、当時の最先端のソフトに「2つのターンテーブルと1つのマイクロホン」と話し掛けたら、「2つのトーン(破れた)レーベルと1つのアイスクリームコーン」と認識したのだが。
もちろん、近年の音声認識技術はもっと優秀だ。マイクロソフト、グーグル、アマゾン・ドットコム、IBM、中国の百度(バイドゥ)などのIT大手やスタートアップが、微妙な言葉遣いまで理解して論理的に返答できる人工知能(AI)システムの開発を進めている。
マイクロソフトは昨年10月、自社の音声認識システムが「人間と同じレベル」になったと発表した。単語誤り率が人間(プロの口述筆記者)と同等の5.9%まで低下したのだ。
グーグルの音声認識サービスは、世界中の言語を次々に習得している。今年8月にもアゼルバイジャン語やジャワ語など30言語が追加され、現在119言語をサポートしている。
IBMのAIプラットフォーム「ワトソン」が、ボブ・ディランと会話をするCMを見たことがある人もいるだろう。ディランの言葉を機械が理解できるなんて画期的ではないか。
急成長中の音声認識ビジネスに、多くの企業が照準を合わせている。アマゾンのAIアシスタント「アレクサ」を搭載した音声認識スピーカー「アマゾン・エコー」が普及すれば、話し掛けるだけで買い物できるのが当たり前になる。
グーグルは8月に、小売り最大手ウォルマートとのネット通販事業の提携を発表。こちらも、音声認識スピーカー「グーグル・ホーム」に話し掛けるだけで注文できるようになる。
ネット通販では、チャットボット(自動会話プログラム)のアプリが注目を集めている。現在は大半が文字入力のテキストでやりとりするが、音声入力も着実に増えている。
調査会社コムスコアによると、20年までにインターネット検索の半分が音声入力に変わるという。既に私たちの買い物の大半は、検索から始まっている。
11年にアップルの音声アシスタント「Siri(シリ)」が登場して以来、携帯電話やアプリが音声を理解するのは当然になった。音声認識技術の研究者による数十年の試行錯誤を思えば、隔世の感がある。
-
- 1
- 2
この記事に関連するニュース
-
Appleの生成AI「Apple Intelligence」でできること 10月から日本で使う方法は?
ITmedia Mobile / 2024年9月10日 17時15分
-
押さえておきたいLLM用語の基礎解説 第1回 AI・大規模言語モデル・生成AI・ニューラルネットワーク・ディープラーニング
マイナビニュース / 2024年9月10日 7時0分
-
米アマゾンの改良版アレクサ、他社製AI「クロード」で動作へ=関係筋
ロイター / 2024年9月2日 11時35分
-
「音声認識AIのための自己教師学習とデータ拡張技術」に関する論文が、音声・言語処理技術の国際会議「INTERSPEECH 2024」で採択
Digital PR Platform / 2024年8月29日 11時2分
-
韓国ネイバー、画像・音声AI技術を「慎重に高度化」
KOREA WAVE / 2024年8月27日 13時0分
ランキング
-
1バイデン米大統領、クアッド制度化狙い「くさび」 「もしトラ」に備え
産経ニュース / 2024年9月22日 19時9分
-
2ヒズボラ、対イスラエル攻撃激化=一斉爆発で「最初の報復」
時事通信 / 2024年9月22日 19時59分
-
3先住民が遺した壁画に「当時の人類が見たはずがない生物」が描かれていた「謎」...南ア大学チーム
ニューズウィーク日本版 / 2024年9月22日 13時5分
-
4中国SNS「日本でも中国人狙った事件多い」 根拠ない投稿で深圳の男児刺殺を矮小化
産経ニュース / 2024年9月22日 17時51分
-
5イラン東部の炭鉱で爆発 少なくとも51人死亡 救助作業は難航
TBS NEWS DIG Powered by JNN / 2024年9月22日 21時21分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください