Infoseek 楽天

加速するAI実用化、日本がやるべきことは?

ニューズウィーク日本版 2024年6月12日 11時45分

冷泉彰彦
<アップルとの提携で、ChatGPTは膨大な量の言語データをアップルユーザーから収集できることになる>

今週10日、アップル社開発者会議(WDC)の基調講演が行われました。今回の目玉は、アップルとオープンAIが包括的な提携をすることで、ChatGPTの機能が多くのアップル製品に実装されるという「アップル・インテリジェンス」構想でした。

スマホなどのデバイスにおけるAIの実用化は、すでに音声認識や画像修正、文法チェックなどでは完全に実用化が進んでいます。ですから、特に衝撃的というわけでもないのですが、市場はこの発表を好感したようで、アップルの株価は上がっています。一部には、AIとのインテグレーションのためには最新のスマホ(iPhone の場合は、15 pro以上でなければ作動しないそうです)への買い替えが進む可能性があり、アップルの業績にはすぐに効果が出てくるという観測もあり、これが株価を押し上げたという解説もありました。

一方で、今回のアップルの発表に噛みついたのが、イーロン・マスクです。マスクは、ChatGPTを提供しているオープンAI社の設立の目的は「全人類への貢献」だったはずだとして、アップル社との提携はこの目的に反すると主張しています。

また、仮にAIのデータとアップルのデバイスが、OSレベルでの深い統合をするのであれば、これは深刻なプライバシーの侵害になるとしています。マスクは、そうした事態になったら、自分の会社内にはアップル製品の持ち込みは禁止するなどと息巻いています。

先を越されたマスク?

マスクの懸念ですが、つまりアップル社の端末がオープンAIのデータベースと連携するということは、例えば iPhone の場合に、端末側で ChatGPT のサービスが利用できるだけではないということです。反対に、端末側のデータについて利用者が許諾すると、そのデータがAIのデータベースに登録されるのです。

例えば写真、音声、文書といったものの全てに関して、あくまで許諾を前提としてはいるものの、アップル端末の利用者が生成する猛烈なボリュームのデータが、AIデータベースに入るということです。データの量も大事ですが、特にオープンAIの側からすると、個人が生成し許諾したデータが大量に得られるわけで、その意味合いは大きいと思います。

今回の発表では、アイディアの卵を育てていくアプリであるとか、ユーザーが絵文字を生成して世界で使ってもらう機能なども紹介されていました。こうした機能も、ユーザー個人の利便性を高めつつ、ユーザーの生成するデータによってAIのデータベースを充実させるという発想と表裏一体になっていると考えられます。

このような包括的提携によって、アップルの側はユーザーに利便性を提供し、オープンAIの側は許諾のある、そして意味のある膨大なデータが手に入ることになります。マスクが懸念を表明している背景には、本当は先を越された悔しさもあるのかもしれません。

日本の場合は、2022年11月30日にChatGPTが一般公開されて以来、AIをより活用するとか、より性能を向上させるといった観点での議論よりも、AIによる著作権侵害などへの懸念の議論が先行していました。ある意味で今回の提携は、日本が積極的に問題提起した懸念への回答という面があるのかもしれません。

日本語のデータ不足が課題に

ですが、そんなことで満足していてはダメです。日本の官民も、よりAIを活用して経済を活性化し、人々の暮らしを豊かにする方向での議論を進めなくてはダメだと思います。さしあたって気になるのは、日本語のデータ不足です。日本語は英語に比べればマイナーですから、そもそもの言語データが足りません。さらに、官民ともに著作権を怖がるだけではデータ収集にも限りがあります。

データが少なければ、AIの吐き出す結果はいつまで経っても使い物になりません。今回のアップルとオープンAIの協業構想を受けて、日本語圏でも合法的に収集できる言語データ量を増やす仕組みを、様々な立場から考えていく必要があると思います。

そう考えると、非英語圏の中では比較的アップル製品が普及している日本では、今回の協業を受けて、アップル製品が生成する日本語データが大量にオープンAIのデータベースに蓄積されてしまうかもしれません。そうならない前に、日本国内でしっかり自国語による言語データ、しかも許諾のあるデータを蓄積する仕組みを構築する必要があると思います。

【関連記事】
都知事選の候補者は東京の2つの課題から逃げるな
バイデンとトランプ、それぞれの苦境


この記事の関連ニュース