Infoseek 楽天

汎用AIが特化型モデルを不要に=サム・アルトマン氏最新インタビュー

ニューズウィーク日本版 2024年5月27日 14時40分

湯川鶴章
<シリコンバレーの著名投資家たちを前にサム・アルトマン氏が語ったこととは>

*エクサウィザーズ AI新聞から転載

OpenAIの最新大規模言語モデル(LLM)「GPT-4o(フォーオー)」の発表前日に、OpenAIのCEO、サム・アルトマン氏のインタビュー動画がリリースされた。同氏のインタビュー動画は珍しくないが、インタビューしたのがシリコンバレーの著名投資家たちで、GPT-4oの前日リリースということで個人的に気になるところをメモした。

テクノロジー業界の最大の関心事と言えば、OpenAIのLLMの次期大型アップデートであるGPT-5がいつリリースされるのか、ということ。GPT-5に関する答えを期待して聞くとアルトマン氏が明確な回答から逃げているように聞こえるので、「内容のない最悪のインタビュー」とコメント欄で酷評される結果になっている。しかしGPT-4o発表後に聞き直すと、アルトマン氏はOpenAIの方針について真摯に答えており、GPT-4oがその方針に従った形でリリースされたことが分かる。注意深く聞くことで、OpenAI単独首位のフェーズから先頭集団のぬきつ抜かれるのフェーズに入った今、OpenAIの戦略のフォーカスの変化をこの動画から汲み取れると思う。

個人的に興味深かったのは、アルトマン氏がいずれ1つの汎用AIモデルが特化型AIモデルを不要にすると考えているところ。OpenAIの動画生成AIのSoraは特化型モデルだが、そうした特化型モデルが必要なのは、いまだ汎用モデルが十分に進化していないから。汎用モデルが完成すれば特化型モデルを開発しなくても、専門領域のシミュレーター、コネクター、データセットに接続するだけで特化型モデルを超えるパフォーマンスをあげることができると、同氏は考えているようだ。

アルトマン氏はまた、AIを賢くするのにはインターネット上の公開データを学習するだけで十分で、賢くなったAIが質問に答える際の参考資料として非公開データを利用することになる、とも語っている。独自にAIモデルを構築することよりも、オープンソースであれクローズドソースであれ、テック大手が開発した最先端モデルに非公開データを連携することのほうが、コスパよくAIを活用できるという考えのようだ。

(注意:以下のメモは直訳ではありません。専門家でなくても意味が分かりやすいようにかなり意訳しています。正確な引用が必要な場合は、それぞれのメモの最初の部分に動画の秒数を記載していますので、直接その部分の動画を見ていただければと思います)

【いつGPT-5をリリースするのか】

(2:41)
過去2、3ヶ月でGPT-4が大きく改良されたか気づいた人も多いと思う。これがこれからのプロダクトリリースの形にしたいと思う。劇的に進化したプロダクトを1年ぶりにリリースするよりも、少し進化した時点で小出しにリリースするほうが、社会にとっては受け入れやすいと思う。(湯川解説:劇的に進化したプロダクトをリリースすると、拒絶反応を示す人が多くなることに気づいたのだという。なのでGPT-4 TurboやGPT-4oというように、継続的、段階的にプロダクトをリリースしている。とはいえGPT-5を出さないというわけではなく、「次の大型ローンチ」という表現をしきりに使っているので、GPT-5がまもなくリリースされることは間違いなさそう)。

(4:29)
われわれが本当にしたいことは、進化した技術を無料でより多くのユーザーに届けること。すごいAGIが未来を引き連れてくるのではなく、多くの人々に未来を発明してもらいたい。その方向で進んでいると思う。今GPT-4レベルの技術を無料で提供できていないことは本当に悲しい。(湯川解説:なのでGPT-4oを無料で解放した)

【オープンソースの台頭をどう見るか】

(6:19)
コスト削減と反応速度の短縮は非常に重要だと考えている。研究開発的にはまだ始まったばかりなので、いつ劇的なコスト削減と反応速度の短縮を実現できるのか明言はできないが、そうすることが我々にとってもユーザーにとっても重要だし、可能だとは考えている。(湯川解説:コスト削減の観点では当然オープンソースの勝ち。また最近は反応速度が短いオープンソースモデルが登場している。OpenAIは、オープンソースに負けないように、コスト面、速度面でモデルの開発を続けているということ)

(7:13)
クローズドソースもオープンソースも、それぞれに重要な役割を担っていると思う。われわれのミッションはAGIを開発して多くの人がその恩恵を受けること。そのためにどうすればいいのかというわれわれなりの考え方があるし、多くの人がその考え方に賛同してくれている。もちろん違う考え方の人もいるが。(湯川解説:OpenAIの考え方とは、最先端のAIモデルをオープンソースで公開してしまえば、人類に危害を与えるAIモデルの開発に悪用される可能性がある、というもの。最先端技術はまずはクローズドでリリースし、その技術が引き起こす社会変化について社会が十分に理解し、その対応策を議論し用意できた段階でオープンソースとして公開するほうが安全だというもの)。

AIの技術開発は大きなエコシステムになっていて、オープンソースでAIモデルを開発する人たちがいるというのはいいことだと思う。僕自身はスマホに搭載できるようなオープンソースのAIの誕生を待っている。

(9:06)
競合他社よりも常にかなり先を行くことができるのではないかと思っている。というかそうでありたいと思っている。一方でコア技術ではない周辺領域にも価値を創造しないといけないと思う。それは他のビジネスと同様、昔ながらのやり方で価値を作っていくしかない。(湯川解説:この部分の発言に、「自分たちの技術、特にこれからリリースするGPT-5の方が、Llama3のような競合のオープンソース技術よりもまだまだ先行している」という自信を感じることができる。一方でオープンソースの追い上げに脅威を感じるので、周辺の事業も手がけないといけないと考えているようだ。この周辺事業とは、例えばGPTストアのようなもの。ユーザーが簡単にカスタムGPTを開発できるツールを無料で提供することで、スマホのアプリストアやユーチューバーのようなエコシステムを構築しようということ。今回の5月13日の発表で、GPTストアを無料ユーザーにまで解放したのは、こうしたエコシステムを盤石なものにしたいからだろう)。

【先頭集団の競争の行方】

(質問:ネット上の公開データを使って学習する段階での競争のフェーズが終わり、次に非公開データで学習するフェーズに入るのか?非公開データで学習する権利をより多く買い取ったところが有利になるのか?)

(13:33)
非公開データの奪い合いにはならないと思う。公開データを学習するだけでも十分にAIは賢くなるので、学習のためにさらなる非公開データまでいらないと思う。賢くなったAIが、特定の領域の推論の際に非公開データを必要とすることはあるだろうけど。(湯川解説:推論とは、学習済みモデルがユーザーの質問に答える行為のこと。質問に答える際に、非公開データセットにアクセスし、そこで得た情報を参考にして回答を生成するという形で非公開データを利用するだけど、LLM自体を賢くさせる学習プロセスに非公開データは不要、という話)

(12:45)
この業界にいて学んだことは、1、2年先のことでも予測するのは非常に難しいということ。なので予言めいたことは言いたくないが、人間を超える知性の実現に向かって、いろんな人がいろんな方法を今後も試していく中で、ちょっとスピリチュアル的な表現を使えば、たまたまだれかが作ったモデルに突然「高度な知性が宿る」みたいな感じになるのではないだろうか。そんな感じで、だれかがブレークスルーを起こすのではないかと思っている。

【半導体とエネルギーの課題をどう解決するか】

(14:16)
半導体もエネルギーも大事だが、アルゴリズムが2倍効率的になれば、必要な半導体もエネルギーも1/2で済む。半導体工場、データセンター、電力などいろいろ問題はあるが、AIは多くの人にとって非常に価値のあるものなので、いずれ問題は解決されるだろうと思う。(湯川解説:この1、2年は半導体不足がAI進化の足枷になっていた。今後は電力不足が問題になると言われているが、AIのアルゴリズムを改良することで電力をそれほど必要としなくなるというのが同氏の意見。実際にGPT-4oはその点で大きな改良があったようで、消費者向けには無料で公開したし、企業向けにはこれまでの半額で使えるようにした)

【スマホの次のデバイスの可能性は】

(15:47)
すごく興味のあること。技術の進化にともなって、新しい形態のデバイスが可能になると思う。でもスマホは信じられないくらいすばらしい。これを打ち負かすのは簡単ではない。AppleのChief Design Officer(最高デザイン責任者)だったJohny Iveとはいろいろ議論しているが、次のデバイスを考え出すのは簡単ではない。

価格が問題なのではない。人々はたとえ低価格でも2台目のスマホは持ちたくないだろう。もっと全然違うものになるはず。それが何か分かっていれば、今頃私はそのデバイスの開発に夢中になっていると思う。ただ音声は次のデバイスのヒントだと思う。(湯川解説:Ive氏はスティーブ・ジョブズの片腕としてアップル製品のデザインを手掛けてきた人物。Ive氏と協議していると報道され話題になっているが事実だったもよう。でもどうやらまだ具体的な製品アイデアにはなっていないようだ)。

(23:57)
いろいろな用途にとってビジュアルUIは非常に便利。それを音声UIに変える必要はない。それぞれのタスクに合ったUIというものがあるのだと思う。

【AI秘書?デジタルツイン?AI幹部?】

(19:21)
常に自分の近くにいて、煩雑な操作が一切ない、そんなAIが欲しい。そういったAIに関しては二通りの考え方があって、1つは自分の延長のようなAI。自分と同じように考えて、自分の代わりにメールの返事を書いてくれたりする。もう1つの考え方は、優秀な経営幹部のようなAI。ほとんどの仕事を任せられるが、自分の延長ではない。自分と違う意見を表明したり、反論してくることもある。イエスマンではない。そんなAIを作りたいと思う。

【AIが大きく変える領域】

(25:52)
注目しているのは教育。家庭教師AIで教育は大きく変わると思う。自分の興味のあることを上手に教えてくれるような家庭教師AIサービスを作ることができて、人々がいろんなことをどんどん学んでいけるようになれば、それはものすごい発明になると思う。

あとはプログラミングの領域もそうだし、ヘルスケアにも注目している。でも一番エキサイティングなのが、科学の領域の発明、発見だ。今必要なのは、論理的思考能力を持った汎用AI。それができれば化学シミュレーターに繋げればいいだけ。科学のための別のアーキテクチャはいらない。(湯川解説:やはり汎用AIがすべての解決策と考えているようだ)

【汎用AIか特化型AIか】

(31:34)
もちろん特定の領域に特化したシミュレーターやコネクター、データセットは必要だが、論理的思考ができるようになれば、特化型モデルは不要だと思う。根拠はないんだが、そんな風に思う。Soraはまだ動画生成特化型モデル。論理的思考が十分に進化していないから作るしかなかった。まだ言語モデルはオートリグレッションモデルだし、画像モデルはデフュージョンモデルだ。まだまだ進化が必要だ。(湯川解説:言語モデルと画像モデルでは別のアーキテクチャーを使っているという話。汎用AIは、1つのアーキテクチャーで言語モデル、画像モデルよりも性能がよくなるはずだという)。

【データのフェアユース】

(34:15)
いろいろな考え方がある。例えば音楽生成AIを作るときにテイラースイフトの楽曲で学習した場合は、テイラースイフトにライセンスフィーを支払うべきだと考える人が多い。ではテイラースイフト以外の楽曲で学習したAIに、テイラースイフトが書くような楽曲を生成してと命令して、テイラースイフトっぽい楽曲を生成した場合はどうだろう。テイラースイフトの曲を学習したことがなくても、「テイラースイフトはポップな音楽を歌う女性アーチスト」というテキストデータがあるだけで、AIはテイラースイフトのような楽曲を生成するかもしれない。その場合はどうすればいいんだろう。個人的には、そういう場合はテイラースイフトにライセンスフィーを支払う必要はないと思う。ただこの辺りはまだ社会として合意に達していない。社会的合意に達していないので、われわれが音楽生成AIを手掛けることは当面ない。

【政府による規制について】

(48:40)
GPT-4レベルのAIはそれほど深刻な被害を人類にもたらすことはないと思う。対応は可能だと思う。ただ、AIが継続的に自己改良できるようになったり、生物兵器を勝手に作れるようになれば、なんらかの国際的な規制が必要だと思う。

【ユニバーサル・ベーシック・インカムについて】

2016年からベーシック・インカムの実験を始めた。AIに真剣に取り組み始めた時期だ。AIの進化が失業者を増やす可能性があると思って、そうした問題を解決する方法をいろいろ試してみようと思った。お金ですべての問題を解決できるとは思っていないが、解決できる問題もあるはずだと思う。

その後のAIの急速な進化を受けて、単純なベーシックインカム以上に効果的な方法があるのではないかと思うようになった。例えばユニバーサル・ベーシック・コンピュートのようなものはどうだろう。すべての人にGPT-7レベルのAIの計算資源を分け与え、その計算資源を自分で活用することも、他人に売却することも、難病の研究に寄付することもできる。そういう形のほうがベーシックインカムよりいいかもしれない。

この記事の関連ニュース