アングル：ディープシーク盗用疑惑、ＡＩ「蒸留」阻止が困難な訳

ロイター / 2025年1月30日 19時1分

　１月２９日、トランプ米政権の複数のアドバイザーは今週、中国の人工知能（ＡＩ）新興企業ディープシークが「ディスティレーション（蒸留）」と呼ばれる手法で米国の競合ＡＩの先行技術を盗み取った可能性があると警鐘を鳴らした。２９日撮影（２０２５年　ロイター/Dado Ruvic）

Stephen Nellis　Krystal Hu　Jeffrey Dastin　Anna Tong　Katie Paul

［２９日　ロイター］ - トランプ米政権の複数のアドバイザーは今週、中国の人工知能（ＡＩ）新興企業ディープシークが「ディスティレーション（蒸留）」と呼ばれる手法で米国の競合ＡＩの先行技術を盗み取った可能性があると警鐘を鳴らした。

ディスティレーションとは、より洗練された強力な従来のＡＩモデルに、新しいＡＩモデルからの質問を精査させて、実質的に従来モデルの学習内容を移行させる仕組み。業界幹部やシリコンバレーの投資家からは、これを防ぐのは難しいのではないかとの声が聞かれる。

ディープシークは米国のオープンＡＩなどのライバルよりもずっと少ない開発費用で彼らと同等の性能を持つＡＩを披露し、ハイテク業界に激震をもたらした。複数の専門家は、ディープシークのこのモデルが、幾つかの米国のモデルの学習成果を転用した可能性があるとみている。

ディスティレーションを使えば、大規模な投資と膨大な電力を費やして従来のＡＩモデルが生み出した果実を、そうした対価なしで新たなモデルが獲得できる。

ＡＩの分野でこの手法はごく普通の技術だが、オープンＡＩを含めて近年米企業が投入した先端的モデルで定められたサービス利用規約には違反する。

オープンＡＩの広報担当者は、中国のグループがディスティレーションを駆使して積極的に同社のＡＩモデルを複製していることが分かっており、ディープシークが不適切なディスティレーションを行ったかどうか検証中だ、とロイターに語った。

サンフランシスコに拠点を置くデータブリックスのＡＩ担当バイスプレジデント、ナビーン・ラオ氏は、ＡＩ業界でライバルから学習するのは「当然のこと」だと説明し、自動車メーカーが他社の車を買ってエンジンを詳しく調べる行動になぞらえた。

「全く公平に言えば、これはあらゆる状況で起きている。競争は実在し、抽出可能な情報があればそれを取り出して勝利しようとする。われわれは良き市民たろうとするものの、同時に誰もが競争している」とした。

トランプ政権の商務長官候補ハワード・ラトニック氏は、上院が２９日に開いた指名承認公聴会で、ディープシークが米国のＡＩ技術を不正利用したもようで、規制措置を講じると表明。「ディープシークが完全に公正な振る舞いをしたとは信じていない。私は厳格に規制を遂行し、米国の優位性を維持していく」と強調した。

ホワイトハウスのＡＩ・暗号資産責任者デービッド・サックス氏は２８日、ＦＯＸニュースのインタビューで、ディープシークのディスティレーションへの不安を示した。

オープンＡＩは声明で「ＡＩ構築の先行者として、われわれはこれまでに投入したモデルが有する先駆的性能のための細心のプロセスを含めた知的財産を保護する対抗措置に取り組む」と述べたが、具体的な内容は明らかにしていない。

ＡＩに関して中国が米国の技術を利用しているという懸念は、以前の半導体を巡る問題に通じる。半導体については米政府が中国向け輸出に規制を導入し、特定の公開技術にも利用制限を設けることを検討中だ。

＜乏しい対応策＞

しかし専門家は、ディスティレーション阻止は見かけほど簡単ではないとくぎを刺す。

ディープシークがもたらしたイノベーションの一つは、より大規模で高性能のモデルから比較的少ないデータサンプルを取り出すだけで、より小型のモデルの性能を劇的に改善できると証明した点だ。

オープンＡＩの対話型ＡＩ「チャットＧＰＴ」のように利用者が何億人にも上るモデルの場合、そうしたごく少量のトラフィックを検知するのは難しいだろう。またメタ・プラットフォームズの大規模言語モデル「Ｌｌａｍａ（ラマ）」やフランス新興企業ミストラルのモデルなどは無料でダウンロードし、民間のデータセンターで利用できる以上、サービス規約違反を探し出すのも非常に骨が折れる。

トムベスト・ベンチャーズのマネジングディレクター、ウメシュ・パドバル氏は「ミストラルやラマのようなオープンソース型モデルが手元にある場合、ディスティレーションを止めるのは不可能だ。顧客経由でオープンＡＩのモデルを発見することもできる」と指摘した。

メタの広報担当者はロイターに、ラマのライセンス供与にはディスティレーションのために使うならばそれを開示することが必須条件になっていると説明した。

ディープシークは今月発表したモデルの一部でラマを使ったと研究論文で明かしたが、それ以前のプロセスでメタのモデルを使用したかどうかについては言及していない。メタの広報担当者は、ディープシークによる規約違反の有無に関する同社の見解はコメントしなかった。

大手のＡＩ研究機関の考えに詳しい関係者によると、ディープシークのような企業によるディスティレーションを防ぐ唯一の道は、金融機関と同様に徹底的な顧客の本人確認制度を採用することだという。だが、そうした制度が設けられる気配はないとしている。バイデン前政権は策定に前向きだったが、トランプ大統領は否定的かもしれない。

自社のクラウドでＡＩモデルを展開するグロックのジョナサン・ロス最高経営責任者（ＣＥＯ）は、中国企業による不正利用防止のため、クラウドに対する中国のＩＰアドレス全てのアクセスを拒否する措置を講じている。

ロス氏は「これは不十分で抜け道を見つけられる。われわれはそれをふさぐアイデアがあるが、『いたちごっこ』になるだろう。解決策は分からないし、誰か提示してくれれば実行したい」と語った。