AIエージェントの時代はどこまできているのか
ニューズウィーク日本版 / 2024年5月7日 12時40分
湯川鶴章
<AIエージェントがどの程度パソコンを操作できるかを探る「OSWorld」論文が注目を集めている>
*エクサウィザーズ AI新聞から転載
今年のAI業界のホットなテーマの1つはAIエージェント。そんな中、エージェントに関する1つの論文が話題になっている。
「OSWorld」というタイトルの論文で、現段階のAIエージェントはどの程度優秀なのかを計測しているもの。著者は香港大学のTao Yu氏を初めとする研究者の国際チーム。
AIエージェントの定義はいろいろあるが、この論文の中では「置かれた環境をセンサーなどで把握し、論理的に行動するAI」のように定義されている。つまり人間のようにパソコンを自在に操作できるAIということだ。
確かに最近のAIは、いろいろなパソコン操作が既に可能だ。もちろんパソコン上のボタンを押すことも、文字、数字を入力できる。アプリやソフトウェアのマニュアルを読んで理解し、アプリやソフトを操作することも可能。プログラミングもある程度できるし、検索、文書生成もできる。テキストを音声に変換し、音声ボットとして電話もできる。営業トークもできる。顧客との電話のやり取りで得た情報を表計算ソフトに入力することもできる。
つまりこの方向でAIが進化すれば、人間がパソコンを使って行う仕事のほとんどは、AIでもできるようになる。AIにできない仕事を探すほうが難しくなるのではないだろうか。そうなればAIエージェントは世界経済に非常に大きな影響を与えることが予測される。今われわれはそうした時代の入り口に立っていると言えそうだ。
ではそうした時代に向けて、今後AIはどのように進化していかなけらばならないだろうか。一般的には3つの技術の進化の方向が挙げられている。
一番大きく進化しなければならないのはReason(論理的思考能力)だろう。人間から与えられた仕事をこなすために、何をどう実行すべきかを考える力だ。1つの大きな仕事をこなすために、その仕事をいくつかのタスクに分解することも必要になってくる。
もうまもなくリリースされると噂されているOpenAIの次期LLM(大規模言語モデル)GPT-5では、論理的思考が大きく進化すると言われている。またOpenAI以外の有力AI企業も同様の能力を持つLLMを開発しているとみられている。
2つ目はVision、つまりコンピューターの画面を見て意味を理解する能力だ。どのボタンをクリックすれば、前のページに戻れるのか、どのボタンを押せば注文を確定できるのかなど、画面上の画像の意味を理解する能力だ。
-
-
- 1
- 2
-
この記事に関連するニュース
-
日本初のAIエージェント搭載ホームIoT端末『ナインドット』をリリース
@Press / 2024年7月25日 12時0分
-
AppleのAI戦略発表はなぜ他社より大幅に遅れたのか 「Apple Intelligence」の真価を読み解く
ITmedia Mobile / 2024年7月19日 11時27分
-
AIと分からないレベルの自然な会話で、100%AI対応のコールセンター実現か|YCが支援するVocode社の技術に注目
Techable / 2024年7月8日 12時0分
-
PowerPool 2.0: 戦略ビジョンの更新、AIエージェント市場の獲得
PR TIMES / 2024年7月3日 13時40分
-
お客さまの困りごとを“ズバリ言い当てる”コールセンター向け生成AIチャットボットの提供開始
PR TIMES / 2024年7月3日 11時15分
ランキング
-
1中距離ミサイル配備と警告=ロシア、独への展開に対抗
時事通信 / 2024年7月28日 19時33分
-
2プーチン大統領 中距離ミサイル配備と改めて警告 ドイツへの長射程ミサイル展開に対抗措置
TBS NEWS DIG Powered by JNN / 2024年7月29日 1時38分
-
3イスラエルが「ヒズボラ」拠点を空爆
TBS NEWS DIG Powered by JNN / 2024年7月29日 3時21分
-
4米カリフォルニア州で山火事急拡大、24時間で2倍に
ロイター / 2024年7月29日 10時27分
-
5ブリンケン米国務長官、ヒズボラの攻撃と非難=イスラエルに自制要請の構え
時事通信 / 2024年7月28日 22時11分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください
![](/pc/img/mission/mission_close_icon.png)