Googleが来場者をざわつかせた「AIとの対話」 OpenAIとの生成AI競争第2幕は「スマホ」へ
東洋経済オンライン / 2024年5月21日 7時30分
GoogleがProject Astraで目指すのは「将来のAIエージェント」だ。AIエージェントとは、人と対話しつつ人をサポートするソフトウェアのことだ。GoogleのAI開発部門「Google DeepMind」は、現在Googleが使っている生成AI技術である「Gemini」を応用しつつ、さらに新しい技術を組み込んで開発を進めている。
AIエージェントでは単に命令を音声で伝えるだけでなく、コミュニケーションが主体になって課題を解決することが重要になる。人間が目や耳から情報を得て、それを対話のために活用するのと同じように、AIエージェントも複数の情報を活用するのが望ましい。
こうした要素を俗に「マルチモーダル」と呼ぶ。GoogleはGeminiを「マルチモーダルが得意なAI」とアピールしてきた。Project Astraはその先にあるものだが、他にも広く活用している。
例えば、動画を撮影しながらそこに映っているものについて質問する「Ask with Video」や、写真を保存するサービスである「Googleフォト」の中から、文章で示したシチュエーションにあった写真を探し出す「Ask Photos」などの新機能がそれにあたる。
マルチモーダル性を備え、音声で対話する生成AIを持っているのはGoogleだけではない。
冒頭で述べたように、Google I/O開催の前日には、OpenAIが「GPT-4o」を発表している。こちらもマルチモーダル性の強化が特徴だ。そして、Project Astraと同じように、人間と話しているような対話を実現している。
OpenAIが狙っているのも、Googleと同様に「人と対話しながら使うサービス」だ。OpenAIが究極的に目指しているのは「汎用人工知能(Artificial General Intelligence、AGI)。AGIが実現されていくなら、人間をサポートするAIエージェントに使われるのは必然である。
AIが人と対話するには、マルチモーダル性とともに「即応性」も必須になる。質問への回答に何秒もかかるようでは会話にならないからだ。
GPT-4oにしてもProject Astraにしても、AIの反応は非常に素早い。GPT-4oはすでにChatGPTの有料版である「ChatGPT Plus」で利用可能になっている。筆者も使ってみたが、従来に比べとにかく回答までの待ち時間が短く驚かされた。
この記事に関連するニュース
-
マイクロソフトが示す“マルチモーダルAI”の可能性、「GPT-4o」が実現する未来の体験とは?
マイナビニュース / 2024年6月28日 10時0分
-
<2024 AIトレンド通信 5月>OpenAIがSpring Updateにて「GPT-4o」発表
PR TIMES / 2024年6月18日 13時45分
-
アップルがAI戦略で「他社に頼った」という大誤解 異なるビジネスモデルでAIに取り組んできた
東洋経済オンライン / 2024年6月14日 7時10分
-
アップル、OpenAIとパートナーシップ 最新版「ChatGPT」Siriから利用可能に
ASCII.jp / 2024年6月11日 11時0分
-
「「GPT-4o」と「Gemini Flash」の衝撃」と題して、米国 VentureClef社 代表/アナリスト 宮本 和明氏によるセミナーを2024年7月18日(木)に開催!!
PR TIMES / 2024年6月6日 14時15分
ランキング
-
1「これやっておいて」「なる早で」と言ってはいけない…エンジニアを怒らせる文系人間のNGセリフ集
プレジデントオンライン / 2024年6月28日 6時15分
-
2「おふたりさま夫婦」だから起る「"相続"の大問題」 妻が夫の遺産を100%相続できないって、本当?
東洋経済オンライン / 2024年6月28日 7時40分
-
3燃料不足で週57便見合わせ 成田発着、海外6社の増便や新規
共同通信 / 2024年6月27日 23時1分
-
4カニ山盛り「2時間1万2000円」ブッフェの破壊力 コロナ禍で怒涛の出店をした企業の正体
東洋経済オンライン / 2024年6月28日 8時50分
-
5万博、紙の入場券を200万枚、10月からコンビニで販売 日時指定不要の入場券も
産経ニュース / 2024年6月27日 22時21分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください