1. トップ
  2. 新着ニュース
  3. ライフ
  4. ライフ総合

「最新の生成AI」はすでに人類の半数以上よりアタマが良い…落合陽一「今後、人類の働き方は大きく変わる」

プレジデントオンライン / 2024年6月21日 9時15分

※写真はイメージです - 写真=iStock.com/BlackJack3D

生成AIの進化が加速している。筑波大学准教授の落合陽一さんは「ChatGPTより正確さや速度で勝る生成AIが誕生している。一時的にはClaude3が性能面でトップに躍り出たが、現在はどれが覇者になるかが全く読めない、戦国時代へと突入している」という――。

※本稿は、『落合陽一責任編集 生成AIが変える未来―加速するデジタルネイチャー革命―』(扶桑社)の一部を再編集したものです。

■本物を選ぶ「審美眼」が必要

現在、数々の生成AIが生まれています。そんななか、よく質問を受けるのが「生成AIを上手に使いこなせる人と使いこなせない人の差」について。僕自身が考える、両者の一番大きな差は「審美眼」だと思います。簡単に言えば、膨大な出力とねばり強く「選ぶ力」ですね。

生成AIが10個のプロトタイプをつくったとしても、その中で採用するものを選ぶのは人間です。その際、「どれがいいのか」をきちんと精査できる目利きの力が必要になります。でも、意外とこれが難しいものです。

たとえば、動画生成AIで「波の動画をつくって」とプロンプト(指示)を入力し、数十秒もすれば、綺麗な波の動画が1個出来上がります。しかし、本来、波の動きというものは非常に複雑な計算によって成り立っているので、物理シミュレーションを駆使して再現しようとすると、現状の生成AIがつくった動画は、物理法則に基づかないものも多いので物理の専門家から見ると、どこか違和感が生まれてしまうものも多いのです。

■「それっぽい自然」が生まれている

しかし、ここからがおもしろい話です。仮に人類の9割が「波」の動きを正しく認知していなかったなら、9割の人は「別にこれでもいい」という判断をするはずです。その場合、正確な動きを再現した動画がなくても十分かもしれませんね。

波の再現動画に限らず、AIで生成された動画は、一見、リアルに見えるけれども、実は本物とはかけ離れていることが多々あります。今後、生成AIで再現されるデータには、そんな「本物っぽく見えるデータ」がたくさん登場することでしょう。そして、その適当なデータでも、人類の大半の人は納得できてしまう。それはもはや「それっぽい自然」、「元来の自然と異なるもの」、すなわち「新しい自然」ではないでしょうか。

昔、研究者たちが自然をコンピュータシミュレーションで再現する場合、緻密な計算を基にした物理現象をベースにしていました。しかし、システムが急速に進化した末、異なる計算プロセスに基づいて生まれた「それっぽい自然」に近づいているというのは、なんとも不思議な話です。

■本物のエベレストの写真はどっち?

でも、このように「それっぽい自然」と「本当の物理現象に基づいたヴァーチャルな自然」が混在した状況だからこそ、大切なのが冒頭にも話題に出た審美眼です。どこまでがそれっぽいAIでどこまでがヴァーチャルか、それとも実在か。その境界線を見定める能力が、AIを使いこなせるかどうかを分けるのだと僕は考えています。もちろん、表現は常に更新されるので、AIっぽいものも美しい実存を超えたものになるかもしれません。

審美眼の重要性を知るために、簡単に実験してみましょう。

たとえば、僕がエベレストの頂上から見た写真が欲しいと思い、画像AIに「エベレストの頂上から撮影した、フォトリアリスティックな写真を生成してくれますか」という指示を与えてみたとします。

せっかくなので、ChatGPTに組み込まれている画像生成AIの「DALL・E3」(画像1参照)と、同じく画像生成AIの「Midjourney」(画像2参照)を使って、画像をつくってみました。どうでしょうか? 仮に同じ指示を与えても、どの生成AIを使うかによって、出来上がるデータには多少の差が生まれることがわかります。

【画像1】DALL・E3でつくったエベレストの写真(左)、【画像2】Midjourneyでつくったエベレストの写真(右)
【画像1】DALL・E3でつくったエベレストの写真(左)、【画像2】Midjourneyでつくったエベレストの写真(右)(出所=『落合陽一責任編集 生成AIが変える未来―加速するデジタルネイチャー革命―』)

■偽者っぽいほうがリアルに近かった

ただし、問題は、僕自身がエベレストの山頂に登ったことがないという点です。だから、本当に正しいエベレストからの風景とは何かがよくわかっていないので、「これは山脈があるからエベレストっぽいな」といったなんとなくのイメージからしか選ぶことができません。

そこで、2つのAIでつくった画像を比較してみると、「『DALL・E3』でつくった写真(画像1)よりも、『Midjourney』でつくった写真(画像2)のほうが本物に近いように見えるなぁ」と思いました。

では、いざ本当のエベレストの写真(画像3)を見てみてください。どうでしょうか? 生成したデータは、実物とは案外違うことがわかります。そして、僕自身が「こっちのほうが偽物っぽいな」と思っていたほうの写真が、実はリアルなエベレストの光景に近かったという結果になりました。

【画像3】本物のエベレストの写真
写真=iStock.com/DanielPrudek
【画像3】本物のエベレストの写真 - 写真=iStock.com/DanielPrudek

このように、審美眼がないと、一見、偽物っぽくてリアリスティックでないもののほうが、実は本物に近いと判断してしまう。そして、これと同じようなケースは、今後多々発生すると思います。しかし、本物が重要かどうかも変わってくるかもしれませんね。

■「ChatGPT」を超えた「Claude3」の実力

生成AIの代名詞的に語られている「ChatGPT」。しかし、生成AIの世界は常に進化しており、ChatGPT以外にも続々と優秀な生成AIが誕生しています。

まず、現在「ChatGPTを凌駕する文章生成AI」として注目されているのが、2024年3月に発表された次世代AIモデル「Claude3」。

【画像4】Anthropicの公式HP
【画像4】Anthropicの公式HP

このClaude3は、数学や物理、歴史、医学など57科目の多領域の学術テストの回答を通じて、その言語モデルの正確さをはかる「MMLU(大規模マルチタスク言語理解・Massive Multitask Language Understanding)」で、86.8%というスコアを記録。2023年4月に誕生したOpenAIのGPT-4(86.4%)や2023年12月にGoogleが発表した「Gemini Ultra」(83.7%)を上回る数値をたたき出しています。

なお、人間の専門家集団の平均回答率が89.8%と言われているので、Claude3の能力は専門家の頭脳とほぼ遜色のないレベルにまで達しているとも言えます。

さらに、ChatGPTは英語に比べると日本語が不得意で、情報の精度が下がる印象がありましたが、Claude3は日本語も得意。そのため、日本人には使いやすいのではないかとも感じます。

■生成AIの賢さは半数以上の人間を凌駕した

MMLU以外の指標でも、生成AIの進化が可視化できます。たとえば、ノルウェーメンサで使われる35問のIQテストを生成AIに受けさせるという試みでは、先に挙げたClaude3はIQ101というスコアを獲得しています。(画像5参照)

【画像5】Maximum Truth, “AIs ranked by IQ; AI passes 100 IQ for first time, with release of Claude-3”より(2024年3月時点)
【画像5】Maximum Truth, “AIs ranked by IQ; AI passes 100 IQ for first time, with release of Claude-3”より(2024年3月時点)

人間のIQの基準値は100とされるため、Claude3が101を記録したということは、パソコン上のテストに関しては人類の半分以上より賢いと言えます。多くの職場のマニュアルは、IQ100前後の知能を対象としてつくられているので、生成AIにマニュアルを覚えさせれば、身体性を伴わない仕事であればほぼ対応可能ということです。今後、AIによって人類の働き方は大きく変わるでしょう。

■ChatGPTの25倍の速さで回答するGroq

ただ、これからずっとClaude3が生成AIのトップを走ると判断するのは早計です。なぜなら、生成AIは驚くほどのスピードで進化しているからです。2022年11月に登場したGPT-3.5のMMLU上でのスコアは70%でした。それからたった1年半の間で、Claude3が86.8%というスコアを獲得したことからも、生成AIの進化のスピード感がよくわかるのではないでしょうか。

落合陽一責任編集『生成AIが変える未来―加速するデジタルネイチャー革命―』(扶桑社)
『落合陽一責任編集 生成AIが変える未来―加速するデジタルネイチャー革命―』(扶桑社)

一時的にはClaude3が性能面でトップに躍り出ましたが、現在はどの生成AIが覇者になるかが全く読めない、戦国時代へと突入しています。

さまざまな生成AIが日々誕生していますが、その得意ジャンルも多様です。たとえば、回答の速さで注目されるのが、カルフォルニア発の半導体スタートアップであるGroqが提供する生成AI「Groq」です。

この生成AIは、大規模言語モデル(LLM)を高速化し、1秒間でほぼ500トークンに近い回答生成を可能にしました。GPT-4のトークン数は1秒間20トークン前後だと言われるので、比較するとGroqはGPT-4の25倍ほど、回答が早いことがわかります。これだけレスポンスが早いと、大量のデータを処理したいときや即座に情報を得たいとき、Groqを有効活用する人も増えるはずです。

■高速スピードの秘密は半導体チップ

なぜGroqが生成AIの中でスピードに関して抜群の優位性を保っているのでしょうか? その理由は使用しているチップにあります。Groqに使われているのは、自社で開発したLPU(Language Processing Unit)というAI処理専用のチップです。

現在、ChatGPTなど多くの生成AIに使われているのは、画像生成などが得意なGPU(Graphics Processing Unit)というチップです。

一方、LPUは、大規模言語モデル(Large Language Models、LLM)の処理に特化しており、GPUよりもコードや自然言語などの一連のデータの処理を高速で行うことができます。だからこそ、Groqは、ほかの生成AIを圧倒する高速化を可能にしているのです。

今後、LLMを基盤とする生成AIにおいて、GroqのようにGPUではなくLPUの使用が一般的になれば、より高速な生成AIが続々と誕生する可能性もあります。

【画像6】Groq公式HPより
【画像6】Groq公式HPより

----------

落合 陽一(おちあい・よういち)
筑波大学准教授、メディアアーティスト
筑波大学でメディア芸術を学び、2015年東京大学大学院学際情報学府にて博士(学際情報学)取得。現在、メディアアーティスト・筑波大学デジタルネイチャー開発研究センター長/図書館情報メディア系准教授・ピクシーダストテクノロジーズ(株)CEO。応用物理、計算機科学を専門とし、研究論文は難関国際会議Siggraphなどに複数採択される。令和5年度科学技術分野の文部科学大臣表彰、若手科学者賞を受賞。内閣府、厚労省、経産省の委員、2025年大阪・関西万博のプロデューサーとして活躍中。計算機と自然の融合を目指すデジタルネイチャー(計算機自然)を提唱し、コンピュータと非コンピュータリソースが親和することで再構築される新しい自然環境の実現や社会実装に向けた技術開発などに貢献することを目指す。

----------

(筑波大学准教授、メディアアーティスト 落合 陽一)

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください