1. トップ
  2. 新着ニュース
  3. 社会
  4. 政治

このままではAI後進国に…「中国版ChatGPT」を使ったジャーナリストが指摘する"残念な現状"

プレジデントオンライン / 2023年5月23日 15時15分

※写真はイメージです - 写真=iStock.com/William_Potter

世界的なAIブームのなか、中国がAI開発に苦戦している。ジャーナリストの高口康太さんは「中国はもともとAI大国として知られていたが、AI開発に必要なデータ収集や最先端の精密機器の入手に後れを取っており、開発が思うように進んでいない。私も実際に『中国版ChatGPT』と呼ばれるバイドゥのチャット型AIを使ってみたが、マイクロソフトのAIと比べて精度は低かった」という――。

■米国と並ぶ「AI大国」として知られていたが…

中国のAI(人工知能)がちょっと変だ。

ChatGPTの爆発的なヒットを受け、今や世界中がAIブームに沸き立っている。中国も例外ではない。検索のバイドゥ、EC(電子商取引)のアリババグループ、ゲーム・メッセージアプリのテンセント、動画アプリ「TikTok」のバイトダンスなど、名だたるIT企業はこぞって参入し、中国版ChatGPTを生み出す競争を始めている。

中国は米国と並ぶAI大国として知られる。スタンフォード大学人間中心AI研究所(HAI)の報告書「2022 AI Index Report」によると、AI関連の論文数では中国が全体の31.04%とトップ。EU・英国の19.05%、米国の13.67%を引き離している。また、AIの活用にも積極的で、さまざまなAIソリューションが開発されている。

「キッチンにネズミがいないか発見するAIカメラ」「高層ビルからポイ捨てしたらすかさず位置を特定して通報するカメラ」といった、「確かに便利かもしれないけど、それわざわざ開発するの?」と驚くようなものまで出回っているなど、豊富なAIプロダクトが根づいている。

となれば、ChatGPTに追いつくAIをあっという間に作り出してしまいそうなものだが、どうやらかなり苦戦しているという。

■中国版ChatGPTを使ってみた

その事実を確かめるため、中国版ChatGPTの1番手として名乗りを上げた、バイドゥのチャット型AI「アーニーボット」(文心一言)を使ってみた。

ChatGPTと同様に、一般的な文章を入力すると返答する仕組みだ。また、ニーズに応じて「レポートを書く」「知識検索」、そして「イラスト作成」という出力方法を選ぶこともできる。

下記の画像は「謝罪の手紙、睡眠不足で原稿の締め切りが守れませんでした」という指示に対する回答だ。思ったよりも長い文章を作成してくれた。締め切りを守れなかったことを謝るだけではなく、「事前に状況を説明しなかったことを謝罪したい」と要素を付け足してくれている点は評価が高い。他にもいくつか文章を作らせてみたが、謝罪文や反省文など型が決まっている文章はかなり得意なようだ。

中国国内で最大の検索エンジンを提供しているIT企業、バイドゥが開発した「アーニーボット」(文心一言)の利用画面
筆者提供
中国国内で最大の検索エンジンを提供しているIT企業、バイドゥが開発した「アーニーボット」(文心一言)の利用画面 - 筆者提供

となると、定型文の文章を大量作成しなければいけない人々にとってはかなり重宝しそうだ。中国だと、その代表格は中国共産党員である。まじめな党員ライフを送るためには、新たな習近平講話の学習会レポートなど、あまりやる気にならない文章を書きまくらなければならない。創造性は発揮すればするほど危険で、他の人と同じ決まり切った文章を書くほうが安全……というわけで、これまではテンプレをコピペして、すこしいじるという手法が横行していたのだが、今後はAIに書かせるという新時代の到来が予見される。

■イラスト生成の精度はあまり高くない

……と思ったのだが、さすがに中国企業が開発したAI、不正利用できないような工夫がほどこされているようだ。

「習近平思想学習会の報告を書いて」とお願いしたところ、「AI言語モデルである私はこの問題にどのように答えるのか、まだ学習しておりません」と断られてしまった。確かに中国共産党員がこぞってAI執筆レポートを提出するようになると、えらい人の怒りが炸裂しそうなだけに、こういう使い方はできないようにしておくべきだろう。

「習近平思想学習会の報告を書いて」という指示の結果を表示した利用画面
筆者提供
「習近平思想学習会の報告を書いて」という指示の結果を表示した利用画面。政治的な文章の生成はNGのようだ - 筆者提供

さて、見事な反省文を書いたアーニーボットだが、小説などクリエイティブな文章を書かせるとどうもうまくいかない。

さらに、イラスト作成機能ではこちらの意図を理解してもらえないケースが多かった。たとえば下記のイラストは「从宇宙看的长城」(宇宙から見た万里の長城)という言葉で生成したものだが、文法を理解できず宇宙と万里の長城を並べたものになっている。

「アーニーボット」(文心一言)が生成した画像
筆者提供
「アーニーボット」(文心一言)が生成した画像。筆者の指示を理解できていない - 筆者提供

米マイクロソフトの「Bing Image Creator」では、同じ中国語の指示を与えても、ちゃんと「宇宙から見た」という意図を正しく理解している。

米マイクロソフトの「Bing Image Creator」に生成させた「宇宙から見た万里の長城」
筆者提供
米マイクロソフトの「Bing Image Creator」に生成させた「宇宙から見た万里の長城」。こちらは指示を的確に理解している - 筆者提供

■“想定外の利用”を恐れて規制が厳しくなっている

文章であれ、画像であれ、生成AIに望み通りの内容を出力させるためには指示を工夫する必要がある。時に“呪文”などと呼ばれることもあるが、インターネット上ではさまざまな工夫がシェアされているのはよく知られているところだ。

ところがアーニーボットはその“呪文”への反応が鈍く、また工夫を積み重ねていると、前述の「AI言語モデルである私はこの問題にどのように答えるのか、まだ学習しておりません」という文言で出力を拒否されてしまう。不正利用ができないような設定が強化されていることは一つの要因だろう。間違っても習近平総書記の悪口や中国共産党を批判するような文章を作らないようにとの配慮だ。一つ間違えば、サービスそのものがお取り潰しになりかねないだけに慎重を期すのは理解できる。

ただ、それだけではない。どうやら中国の生成AIは今、壁にぶちあたっているのだという。

■「すでにアメリカを超えた」と豪語していたが…

冒頭で述べたとおり、中国は米国と並ぶAI大国である。その強みを確認しておこう。

中国国旗のCPU
写真=iStock.com/MF3d
※写真はイメージです - 写真=iStock.com/MF3d

AIの開発にはアルゴリズム、コンピューティングパワー、データという3つの要素が必要になる。このうちアルゴリズムは論文やオープンソースソフトウエアとして公開されるため、後発国でも追いつきやすい。コンピューティングパワーはGPUメーカーのNvidia(エヌビディア)を筆頭に米国企業が圧倒的なシェアを握るが、中国はその製品を購入すればことは済む。

そして、データだ。データ関連の法規、規制が緩く、企業がデータを入手しやすい。IT企業の事業分野が広く、幅広いデータを収集できることも強みだ。さらに辺境の農民など低賃金の労働者が多く、アノテーション(データへのタグ付け)に関するコストが安いことも相まって、この点では他国を上回る優位性を持っている。

元グーグル中国総裁にして、生成AIスタートアップ「Project AI2.0」を今年創業した李開復(リー・カイフー)は著書『AI世界秩序 米中が支配する「雇用なき未来」』(日本経済新聞出版、2020年)で、「(AIビジネスに取り組む中国の)企業家集団は、中国テクノロジー界のもう一つの“天然資源”、すなわち、有り余るほどのデータにアクセスできる。中国のデータ生産量は、すでにアメリカを超えた」と指摘し、AI開発競争では中国が優位に立つとの見通しを示していた。

ところが、今、この強みが失われている。

■アプリに阻まれデータ収集に後れを取っている

ChatGPTのトレーニングに使われているデータには書籍、雑誌、ネット掲示板「Reddit」、そしてオープンデータ「コモン・クロール」、グーグルが公開するデータセット「C4」などが活用されている。これらのデータの多くは英語であり、中国語を含む非英語圏のデータはきわめて少ない。中国の大手IT企業は独自に対話型AIの基礎となる大規模言語モデルの開発に取り組んできたが、共有の中国語データセット整備の動きが乏しかった。

また、中国は世界一のスマホ大国であり、多くのデータはインターネットでは公開されず、スマートフォンアプリからしかアクセスできず、収集が難しい。匿名を条件に筆者の取材に応じた、中国人のエンジニアによると、「ChatGPTが出てから、オープンなデータが全然足りていないという現実にようやく気がついたところだ」と話している。

そのため、中国の対話型AIも英語のデータを使って開発されていることが多く、質問文を英訳してからAIが処理していることも多い。バイドゥのアーニーボットに「王冰さんの絵を描いてくれ」とリクエストしたところ、「氷の王様」の絵が出力されたという笑い話もある。王冰(ワン・ビン)という人名を翻訳した時に、「アイス・キング」と翻訳したがゆえの失敗だ。

Baiduの本社ビル
写真=iStock.com/V2images
※写真はイメージです - 写真=iStock.com/V2images

■劣化版のGPUを購入するしかない

データに加えて、中国のAI開発のネックとなっているのが米国の半導体規制だ。昨年に導入された規制によって、中国企業はAI開発には欠かせない最先端のGPU(グラフィック・プロセッシング・ユニット)の購入が禁じられた。

米Nvidiaは規制に抵触しないよう性能を低下させたA800、H800を中国向けに販売している。対話型AIの開発は1万基ものGPUが必要となるほど、コンピューティングパワーが重要な要素を占める。“劣化版”しか入手できないとあっては、フルスペックの製品を購入した他国企業との開発競争で劣位に立たされることは否めない。

■気がつけば不利な状況にはまりこんでしまった

中国企業を悩ませているのは米国の規制だけではない。中国共産党は今年1月、AIによって作られたテキスト、画像、動画、音声などを規制する法案を施行している。中国共産党の価値観に合ったAIを作ることという無理筋の要求があるほか、著名人のフェイク画像を作れないようにするなどAI企業に対応を求めている。さらに対話型AIを対象とした新たな規制作りにも着手している。

企業家から見れば、中国共産党に目を付けられたら一発アウト。AIが習近平総書記や中国共産党の批判をしないようにするのはもちろん、フェイクニュースや詐欺などに悪用されないよう配慮する必要があるが、現時点で対策することはかなり難しい。

本家のChatGPTがそうであるように、いまの対話型AIでは「ハルシネーション」と呼ばれる、もっともらしいウソをついてしまう問題がついてまわるためだ。アーニーボットのように、危険な回答をしかねないケースでは回答不能と逃げるなどの形で対策するしかない。

スマートフォンを超える革命的技術といわれる対話型AI。中国企業もこのチャンスを見逃すわけにはいかないが、気づけばかなり不利なポジションにはまりこんでしまっていた……というのが現状のようだ。

----------

高口 康太(たかぐち・こうた)
ジャーナリスト/千葉大学客員准教授
1976年生まれ。千葉県出身。千葉大学人文社会科学研究科博士課程単位取得退学。中国経済、中国企業、在日中国人社会を中心に『週刊ダイヤモンド』『Wedge』『ニューズウィーク日本版』「NewsPicks」などのメディアに寄稿している。著書に『なぜ、習近平は激怒したのか』(祥伝社新書)、『現代中国経営者列伝』(星海社新書)、編著に『中国S級B級論』(さくら舎)、共著に『幸福な監視国家・中国』(NHK出版新書)『プロトタイプシティ 深圳と世界的イノベーション』(KADOKAWA)などがある。

----------

(ジャーナリスト/千葉大学客員准教授 高口 康太)

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください