アングル:ディープシーク盗用疑惑、AI「蒸留」阻止が困難な訳
ロイター / 2025年1月30日 19時1分
1月29日、トランプ米政権の複数のアドバイザーは今週、中国の人工知能(AI)新興企業ディープシークが「ディスティレーション(蒸留)」と呼ばれる手法で米国の競合AIの先行技術を盗み取った可能性があると警鐘を鳴らした。29日撮影(2025年 ロイター/Dado Ruvic)
Stephen Nellis Krystal Hu Jeffrey Dastin Anna Tong Katie Paul
[29日 ロイター] - トランプ米政権の複数のアドバイザーは今週、中国の人工知能(AI)新興企業ディープシークが「ディスティレーション(蒸留)」と呼ばれる手法で米国の競合AIの先行技術を盗み取った可能性があると警鐘を鳴らした。
ディスティレーションとは、より洗練された強力な従来のAIモデルに、新しいAIモデルからの質問を精査させて、実質的に従来モデルの学習内容を移行させる仕組み。業界幹部やシリコンバレーの投資家からは、これを防ぐのは難しいのではないかとの声が聞かれる。
ディープシークは米国のオープンAIなどのライバルよりもずっと少ない開発費用で彼らと同等の性能を持つAIを披露し、ハイテク業界に激震をもたらした。複数の専門家は、ディープシークのこのモデルが、幾つかの米国のモデルの学習成果を転用した可能性があるとみている。
ディスティレーションを使えば、大規模な投資と膨大な電力を費やして従来のAIモデルが生み出した果実を、そうした対価なしで新たなモデルが獲得できる。
AIの分野でこの手法はごく普通の技術だが、オープンAIを含めて近年米企業が投入した先端的モデルで定められたサービス利用規約には違反する。
オープンAIの広報担当者は、中国のグループがディスティレーションを駆使して積極的に同社のAIモデルを複製していることが分かっており、ディープシークが不適切なディスティレーションを行ったかどうか検証中だ、とロイターに語った。
サンフランシスコに拠点を置くデータブリックスのAI担当バイスプレジデント、ナビーン・ラオ氏は、AI業界でライバルから学習するのは「当然のこと」だと説明し、自動車メーカーが他社の車を買ってエンジンを詳しく調べる行動になぞらえた。
「全く公平に言えば、これはあらゆる状況で起きている。競争は実在し、抽出可能な情報があればそれを取り出して勝利しようとする。われわれは良き市民たろうとするものの、同時に誰もが競争している」とした。
トランプ政権の商務長官候補ハワード・ラトニック氏は、上院が29日に開いた指名承認公聴会で、ディープシークが米国のAI技術を不正利用したもようで、規制措置を講じると表明。「ディープシークが完全に公正な振る舞いをしたとは信じていない。私は厳格に規制を遂行し、米国の優位性を維持していく」と強調した。
ホワイトハウスのAI・暗号資産責任者デービッド・サックス氏は28日、FOXニュースのインタビューで、ディープシークのディスティレーションへの不安を示した。
オープンAIは声明で「AI構築の先行者として、われわれはこれまでに投入したモデルが有する先駆的性能のための細心のプロセスを含めた知的財産を保護する対抗措置に取り組む」と述べたが、具体的な内容は明らかにしていない。
AIに関して中国が米国の技術を利用しているという懸念は、以前の半導体を巡る問題に通じる。半導体については米政府が中国向け輸出に規制を導入し、特定の公開技術にも利用制限を設けることを検討中だ。
<乏しい対応策>
しかし専門家は、ディスティレーション阻止は見かけほど簡単ではないとくぎを刺す。
ディープシークがもたらしたイノベーションの一つは、より大規模で高性能のモデルから比較的少ないデータサンプルを取り出すだけで、より小型のモデルの性能を劇的に改善できると証明した点だ。
オープンAIの対話型AI「チャットGPT」のように利用者が何億人にも上るモデルの場合、そうしたごく少量のトラフィックを検知するのは難しいだろう。またメタ・プラットフォームズの大規模言語モデル「Llama(ラマ)」やフランス新興企業ミストラルのモデルなどは無料でダウンロードし、民間のデータセンターで利用できる以上、サービス規約違反を探し出すのも非常に骨が折れる。
トムベスト・ベンチャーズのマネジングディレクター、ウメシュ・パドバル氏は「ミストラルやラマのようなオープンソース型モデルが手元にある場合、ディスティレーションを止めるのは不可能だ。顧客経由でオープンAIのモデルを発見することもできる」と指摘した。
メタの広報担当者はロイターに、ラマのライセンス供与にはディスティレーションのために使うならばそれを開示することが必須条件になっていると説明した。
ディープシークは今月発表したモデルの一部でラマを使ったと研究論文で明かしたが、それ以前のプロセスでメタのモデルを使用したかどうかについては言及していない。メタの広報担当者は、ディープシークによる規約違反の有無に関する同社の見解はコメントしなかった。
大手のAI研究機関の考えに詳しい関係者によると、ディープシークのような企業によるディスティレーションを防ぐ唯一の道は、金融機関と同様に徹底的な顧客の本人確認制度を採用することだという。だが、そうした制度が設けられる気配はないとしている。バイデン前政権は策定に前向きだったが、トランプ大統領は否定的かもしれない。
自社のクラウドでAIモデルを展開するグロックのジョナサン・ロス最高経営責任者(CEO)は、中国企業による不正利用防止のため、クラウドに対する中国のIPアドレス全てのアクセスを拒否する措置を講じている。
ロス氏は「これは不十分で抜け道を見つけられる。われわれはそれをふさぐアイデアがあるが、『いたちごっこ』になるだろう。解決策は分からないし、誰か提示してくれれば実行したい」と語った。
この記事に関連するニュース
-
ディープシーク、オープンAIのAIモデルが学習した内容を「蒸留」か…「不適切に利用した可能性」
読売新聞 / 2025年1月30日 19時55分
-
米技術利用を問題視=中国生成AI、規制強化も―米商務長官候補
時事通信 / 2025年1月30日 15時27分
-
オープンAI、中国企業が米国のAI技術を模倣と指摘
AFPBB News / 2025年1月30日 12時1分
-
中国ディープシークがオープンAIからデータ不正入手か…米海軍「いかなる場合でも使用不可」
読売新聞 / 2025年1月29日 18時7分
-
ディープシーク、オープンAIデータ不正入手か MSが調査=報道
ロイター / 2025年1月29日 14時42分
ランキング
-
1「無料Wi-Fi」利用時の落とし穴…スマホの安全対策は大丈夫? 安心して使うためのポイントを解説
ファイナンシャルフィールド / 2025年1月30日 10時10分
-
2フジ、CM減収233億円=中居さん問題で赤字へ―親会社、業績下方修正
時事通信 / 2025年1月30日 21時1分
-
3《笑福亭鶴瓶の冠番組が放送休止》「このタイミングでなぜ…」疑問にテレビ局広報が回答した“意外な理由”「一連の報道とは関係がありません」
NEWSポストセブン / 2025年1月30日 19時45分
-
4「しれっと訂正した文春」フジとの"ズルい共通点" 批判の矛先が次は週刊文春に向かっているが…
東洋経済オンライン / 2025年1月30日 15時45分
-
5為替相場 31日(日本時間 6時)
共同通信 / 2025年1月31日 6時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください