ChatGPTに迫る勢い…Google China元社長の中国ユニコーンが手掛けた生成AIモデル「Yi-34B」が気になる
Techable / 2024年2月1日 18時0分
OpenAIの対話型AI“ChatGPT”が登場して早1年。昨今はさまざまな国で新たな生成AIが開発されているものの、いまだにChatGPTが完全独走の状態だ。
ところが、最近になって2023年に設立されたばかりの中国の生成AIスタートアップ“01.AI”の大規模言語モデル「Yi-34B」がChatGPTに迫る勢いでユーザー数を伸ばし続けている。
Google Chinaの元CEOが設立した01.AI01.AI(零一万物)は、中国・北京を拠点に、グローバルに展開している生成AI企業だ。2023年11月にユニコーンの仲間入りを果たし、注目を集めている。
創設者はGoogle Chinaの元社長の李 開復(リー・カイフ)氏。カーネギーメロン大学にてコンピューターサイエンスの博士号を取得した人物で、AIに関する書籍「AI Superpowers」の著者として知られている。
同社の使命は、LLMによって人間の生産性を向上させ、経済や社会に大きな変化をもたらす「AI 2.0時代」に貢献することだ。多くのAI企業が“人間を超えるAIの能力”をアピールするなか、あくまでも“人”を基盤にした「Human+AI」をモットーとしている。
中国発・オープンソースの大規模言語モデル「Yi-34B」そんな01.AIが提供している生成AIがYi-34Bだ。同モデルはゼロからトレーニングされたオープンソース型の大規模言語モデル。英語・中国語に対応しており、個人・学術・商用(とくに中小企業)の目的に適しているという。
Yi-34Bは、Meta AIの大規模言語モデル“LLaMA”と同じく「Transformer 構造」を採用。Transformer構造に基づいたLLaMAは優れた安定性、信頼性の高いコンバージェンス、堅牢な互換性を誇り、オープンソース モデルの新たな基盤として注目されている。
LLaMAと同じTransformer構造を採用することで、Yi-34BはLLaMA エコシステム内の既存のツール、ライブラリ、リソースを活用することが可能に。新しいツールを作成する必要がなくなり、開発効率が向上する。
より多様な応答を生成するチャットモデルYi-34Bのチャットモデルは、Supervised Fine-Tuning(SFT)を使用した専用のトレーニングを受けている。ほかの標準的なチャットモデルと比較して、より多様な応答を生成するため、クリエイティブ・シナリオなどのさまざまなタスクで役立つだろう。
さらに、この多様性により高品質の応答が生成される可能性が高まり、その後の強化学習トレーニングが有利になると期待されている。
評価サイトで「Yi-34B」がChatGPTの次にランクインYi-34Bの注目すべき点は、比較的に少ないパラメーター数でありながらも高評価を得ていることだ。
トップを走るChatGPTはパラメーター数3550億、競合となるFalcon-180Bがパラメーター1800億、LlaMa2‐70Bが700億だが、Yi-34Bは340億である。
ほかの言語モデルよりもバロメータ数が少ないものの、2023年10月には中国の言語モデルのベンチマークサイトSuperCLUEで、Yi-34B(中国語機能)がBaidu ERNIE、Qwen、Baichuanなどを上回り、GPT-4に次いで2位にランクイン。
その後12月には、言語モデルのベンチマークサイトAlpecaEvalで、Yi-34B(英語機能)は競合を追い抜きChatGPTの次にランクインした。
どうやら、パラメーター数が多ければいいというわけではないらしい。ちなみに、NVIDIAのサイトからYi-34Bのお試し版が利用可能だ。英語と中国語がメインだが、日本語でも答えてくれた。気になる方は試しみてはいかがだろう。
今回のYi-34Bのように、ChatGPTの地位を脅かすAIは度々登場している。たとえば、中国科学院・清華大学研究者らが開発した“Xwin-LM”もその1つだ。
中国のLLM系の生成AIは現在130もあり、世界全体の40%を占めるという。米国が世界シェア50%でリードするなか、今後もますます熾烈な戦いが予想されている。
参考・引用元:01.AI公式サイト
(文:MI001YOU)
外部リンク
この記事に関連するニュース
-
カラクリ、世界で初めてAWS TrainiumでMoEモデルを学習した「KARAKURI LM 8x7B Chat v0.1」を公開
PR TIMES / 2024年5月21日 11時15分
-
ハルシネーションを大幅抑止し専門的な質問にも正確な回答が可能な生成AI ストックマーク 1,000億パラメータ規模の独自LLMを公開
PR TIMES / 2024年5月16日 12時45分
-
スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開
PR TIMES / 2024年5月10日 17時15分
-
アリババクラウド、Qwen(通義千問)、初年度9万社以上の企業採用を達成
PR TIMES / 2024年5月10日 11時45分
-
rinna、Llama 3の日本語継続事前学習モデル「Llama 3 Youko 8B」を公開
PR TIMES / 2024年5月7日 13時45分
ランキング
-
1「こんなに種類あるんですね」 コレクターが収集した交通系ICカードの数々に「すごい」「素敵です」
ねとらぼ / 2024年6月2日 20時45分
-
2「LUMIX S9」のストックフォト問題は何がいけなかったのか?
ITmedia NEWS / 2024年6月2日 7時20分
-
3AIの急速な導入がWindowsの予定を変えた!? Windows 12がすぐには出ない可能性
ASCII.jp / 2024年6月2日 10時0分
-
4タイヤを転がし続けて16年!? マルゼンCMが令和にバズる CM誕生のきっかけや16年継続した理由を本人に聞いた
ねとらぼ / 2024年6月1日 20時30分
-
5その「スタート」ボタン、広告かも 国民生活センターが注意喚起 意図しないサブスク契約の可能性も
ITmedia NEWS / 2024年5月31日 21時39分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください