人間に近づいた「GPT-4o」3つの進化のポイント あえて人間ぽくした?広がる「擬人化トレンド」
東洋経済オンライン / 2024年5月15日 7時0分
「私にとって魔法のようだ」ーー。サム・アルトマンCEOがそう予告していた新たなサービスがベールを脱いだ。
【写真】OpenAIで最高経営責任者を務めるサム・アルトマン
アメリカのOpenAIは5月13日、ChatGPTから使える新たな生成AIモデル「GPT-4o(フォー・オー)」を発表した。このAIの「知能」はこれまでのGPT-4と基本的に同じだが、応答時間を大幅に短縮するなど「使い易さ」で進化したという。
有料のGPT-4とは対照的にGPT-4oは無料ユーザーでも利用できるが、時間当たりの利用回数などが有料ユーザーに比べて制限される。無料化によってなるべく多数の利用者に使ってもらうことでChatGPTのユーザーベースを拡大し、飛躍的な進化が期待される次世代モデル「GPT-5」(まず間違いなく有料化される)のリリースに向けて足場を固めようとしている意図がうかがえる。
本稿では3つの「進化のポイント」に解説したい。
従来より「自然な会話」ができるように
その1:応答速度と使い勝手(UI:User Interface)の向上
今回の改良(GPT-4o)では特にスマホやタブレットからの利用を想定し、ChatGPTのようなAIと音声でチャットする際の応答時間を大幅に短縮した。OpenAIの発表によれば平均で0.3秒程度とされる。
またAIが話している最中にユーザーが割って入り、突如話題を変えたり新しいリクエストを出したりすることもできる。こうした工夫により、従来よりも自然で自由な会話ができるようになったという。
さらに2人のユーザーの間でAIが英語とイタリア語などの異なる言語を同時通訳するデモ動画が公開されるなど、より多彩な利用シーンを想定している。現時点で日本語を含む50種類の言語に対応しているという。
その2:ネイティブなマルチモーダル(多メディア対応)機能
テキストや画像、音声など多彩なコンテンツ(メディア)を理解して処理することができる。例えばスマホで撮影された映像に何が映っているかをAIが認識し、それによって視覚障害者に適切なアドバイスをするデモ動画が公開されている。
また自撮り写真をアップロードすると、それを基にしてAIが似顔絵(イラスト)を描いてくれたりもする。
ちなみに「GPT-4o」のoは、本来ラテン語で「全て」を意味する「omni(オムニ)」に由来するという。特に今回の場合はテキスト、動画、音声など「すべてのコンテンツ」という意味であろう。
この記事に関連するニュース
-
OpenAI、軽量で安価なマルチモーダルAI「GPT-4o mini」リリース
ITmedia NEWS / 2024年7月19日 6時50分
-
もはや「ChatGPT」で騒いでいる場合ではない? 深みある日本語を生成するAI「Claude」の凄さ
東洋経済オンライン / 2024年7月15日 8時20分
-
アイスマイリー、Web雑誌「GPT-4oビジネス変革」を本日リリース!
@Press / 2024年7月5日 9時0分
-
ChatGPTよりも安全を掲げる"憲法AI"の可能性 AIをトレーニングし安全・無害・誠実な出力を行う
東洋経済オンライン / 2024年7月1日 11時30分
-
マイクロソフトが示す“マルチモーダルAI”の可能性、「GPT-4o」が実現する未来の体験とは?
マイナビニュース / 2024年6月28日 10時0分
ランキング
-
1メルカリ「フルリモート廃止?」に私が感じたこと 一体感を得るには「ある種の非効率さ」も重要だ
東洋経済オンライン / 2024年7月26日 11時0分
-
2エリート官僚にトラックドライバーの気持ちはわからない…「長時間労働の禁止令」に運転手たちが猛反発のワケ
プレジデントオンライン / 2024年7月26日 8時15分
-
3<最低賃金、過去最大増の1054円>それなのにパート、アルバイトから大ブーイングのワケ「扶養控除ライン据え置きはオフサイドトラップ」「賃金はオーストラリアの半分」「政治家の報酬だけは世界トップクラス」
集英社オンライン / 2024年7月26日 18時56分
-
4再送-NY外為市場=円が対ドルで一時2カ月半ぶり高値、米GDP受け伸び悩み
ロイター / 2024年7月26日 6時40分
-
5スキマバイト「タイミー」が上場、27歳社長の素顔 時価総額1000億円超「ユニコーン」に導いた手腕
東洋経済オンライン / 2024年7月26日 9時0分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください