Infoseek 楽天

「Copilot+ PC」って何だ!? 「AI PC」は早くも第2世代へ

ITmedia PC USER 2024年6月18日 6時0分

 6月18日、「Copilot+ PC」が一斉に販売開始となった。Copilot+ PCは、Microsoftが定義する新しい世代のAI PCだ。5月に開かれた「Build 2024」にて発表された。

 Copilot+ PCのイノベーションは、ハードウェアとソフトウェア(OS)の足並みをそろえたところにある。「AI仕様に再構築」されたWindows 11とハードウェア(NPU)の相乗効果により、これまでにない新しいAI体験ができるPCとなっている。

 AI PCを巡る動きはとても速い。ここでは、Copilot+ PCの登場のタイミングに合わせて、改めてCopilot+ PCとは何かについてまとめておこう。

●AI PCとは何か?

 そもそも「AI PC」とは何だろうか。AIが使えるPCという意味であれば、インターネットにアクセスしてChatGPTやCopilotが使えるPCは全て当てはまるが、それは通常AI PCとは呼ばない。

 「AI PC」という言葉が言われるようになったのは、2023年にIntelのCore Ultraが登場してからだろう。Core UltraがAI処理に特化したプロセッサ「NPU」を統合し、MicrosoftがそのタイミングでNPUを活用できる新しいカメラ効果機能(Windows Studio Effects)を導入したことが大きい。

 Copilot+ PC以前のAI PCに対する業界の共通認識は、以下のようなものだろう。

・NPUを搭載している

・ローカルAIアプリを利用できる

 つまり、「AIの計算処理を手元のPC(ローカル)で行う」「AI処理に特化した専用の回路(NPU)を実装している」ということが重要だ。NPU(Neural Processing Unit)はAI処理に特化したプロセッサで、NPUがあればAI推論処理をNPUにオフロードできるため、CPUやGPUの負荷を減らせる。

 AI推論の主流は、8bitの整数演算(INT8)だ。これに最適化したNPUは、汎用(はんよう)的な演算を行なうCPUやGPUに比べてはるかに構造がシンプルで規模も小さいため、電力効率のメリットも大きい。

 IntelのCore Ultraや、AMDのRyzen 8040(7040)シリーズ(一部例外あり)を搭載し、Windows Studio Effectsが利用できるPCがそれにあたる。

 ただ、この時点ではNPU自体の性能は高くなく、Windows Studio Effectsによるカメラ効果以外にNPUを有効活用できるアプリも少なかった。これが、いわゆるAI PCの第一世代だ。

●新世代AI PC=Copilot+ PCではNPU性能が大幅強化

 MicrosoftとIntelは2月にAI PCの定義を共同で定めたことを発表しているが、そこから解像度を一段高めたのが、冒頭で触れたCopilot+ PCであり、Copilot+ PCと共に「AI PCの新しい要件」を公開している。

 その要件は、以下のような内容だ。

・Microsoftが承認したCPUまたはSoC

  →40TOPS(1秒当たり40兆回)以上の推論処理を行えるNPUの搭載が必要

・16GB以上のDDR5/LPDDR5規格メモリ

・256GB以上のSSD/UFSストレージ

 Copilot+ PCは上記の要件を全て満たす。さらに薄型で軽量、長時間のバッテリー駆動という点もアピールされているが、この点についての明確な要件は特に公開されていない。

 要件で注目すべきは、NPUの演算能力が具体的に指定されたことだ。Core Ultra(開発コード名:Meteor Lake)のNPUは11TOPS(CPUとGPU合わせて34TOPS)、Ryzen 8040シリーズ(同:HawkPoint)のNPUは16TOPS(CPUとGPU合わせて39TOPS)であるから、かなり高いレベルのNPUが要求されていることが分かる。

 なお、TOPS(トップス)というのは「Tera Operations per Second」の略で、1秒間に何兆回の演算処理ができるかを表す。似たような指標として「TFLOPS(テラフロップス)」という言葉を聞いたことがあるかしれないが、TFLOPS(Tera Floating-point Operations Per Second)は浮動小数点演算処理の回数を示す指標だ。AIの推論処理では整数演算(INT8)が主流のため、TOPSが使われている。

●Qualcommが先行してIntelとAMDも続く

 現在、Microsoftに承認されている発表済みのCPUは、QualcommのSnapdragon X EliteまたはX PlusシリーズとAMDのRyzen AI 300シリーズ(開発コード名:Strix Point)の2種類だ。

 Snapdragon X Eliteは45TOPSのNPU、AMDのRyzen AI 300シリーズは最大50TOPSのNPUを統合している。

 Intelが開発中の次世代CPU(開発コード名:Lunar Lake)は、45TOPSのNPUを搭載し、CPUコアとGPUコアを合わせた全体では、最大120TOPSの処理性能を持つことが明かされている。

●Microsoftが新たに提供するローカルAIアプリ

 これまでNPUのメリットを実感できる場面は、Windows Studio EffectsによるWebカメラのエフェクトのみだったが、Copilot+ PCではこれが大きく変わる。

 Microsoftは「Windowsの再構築」に取り組んでおり、Copilot+ PCと合わせて、ローカルAIで動作する数々の新機能を盛り込んでいる。

リコール

 ファイル/画像/テキストなど、PC上で見たもの、操作したものを簡単に探し出すことができる。見つけたいものの手がかりを入力するだけで、PCが候補を探し、表示してくれる。リコールの機能はユーザーの行動を「セマンティックインデックス」という新しい仕組みを利用して記録することで実現される。

 ただ、この機能は便利な反面、プライバシーやセキュリティの確保に課題を抱えている。二転三転した後、当面はWindows Insider Programでのみ提供されることになった。

コクリエイター

 「ペイント」アプリで利用可能になる生成AI機能で、キャンバスに描いたスケッチを洗練されたアートに変えてくれる。スタイルの選択とテキストでの指示が行え、どの程度スケッチを残すかは「創造性」のスライダーで調整できる。

Restyle Image

 写真のスタイルをAI機能で修正、加工する機能だ。スタイルの選択やテキストプロンプトでの指示により背景や前景を変更したり、写真全体の雰囲気を変えたりすることができる。

ライブキャプション

 ビデオやオーディオをリアルタイムで英語に翻訳し、字幕を生成する機能。44カ国語に対応している。ただし、現時点では「英語から他言語への翻訳」「他言語から他言語への翻訳」には非対応だ。

Windows Studio Effects

 カメラの映像にリアルタイムに適用されるエフェクト。以前より機能が拡張、整理された。人物や背景の照明を自動調整する「ポートレートライト」、画面のコンテンツを読んでいる時でもカメラ目線を維持できる「アイコンタクト/テレプロンプター」、映像の雰囲気を変える「クリエイティブフィルター」といった機能を使える。

●Windows Copilot Runtimeで「AI OS」へと進化したWindowsがAI開発を加速

 Microsoftは、Build 2024において、Windows用のAI開発プラットフォーム「Windows Copilot Runtime」も発表し、APIを利用したローレベルの開発からライブラリーを利用した機能の組み込みまで、さまざまなレイヤーでAIを利用したWindowsアプリが開発しやすくなる環境を整えた。

 Copilot+ PCで利用可能になる新しい機能も、このプラットフォームがベースになっている。Windows Copilot Libraryとして、OS標準AIアプリのベースとなっているリコール(セマンティックインデックス検索)やStudio Effects(映像効果)、Text Recognition(OCR、画像からのテキスト抽出)、Phi Silica(小規模言語モデル)などが提供される他、DirectML(DirectX同様のローレベルAPI)、PyTorch(Pythonのライブラリー)、WebNN(Web用ブラウザ用API)などもサポートされる。

 これにより、開発者はPCにローカル搭載されたNPUやGPUを活用するAI機能を組み込んだアプリを開発しやすくなる。今後、NPUやGPUを活用するWindows用AIアプリが積極的に開発されるための下地が整ったことで、40TOPS以上のNPUを搭載するCopilot+ PCのアドバンテージはどんどん大きくなっていきそうだ。

●MicrosoftのローカルAIアプリはNVIDIAのGPUでも利用可能に

 Copilot+ PCの流れで浮上する疑問が「NVIDIAのGPUで、Microsoftが提供する新しいローカルAIアプリは高速化できないの?」ということだ。

 NVIDIA GeForce RTXリシーズにはAI推論に特化したTensorコアが統合されており、対応アプリでは、AI推論を利用した超解像処理や特殊効果処理などを利用できる。その性能は、初代のGeForce RTX 20シリーズから40TOPSという水準を軽く超えており、NVIDIA GeForce RTX 4090では1321TOPSにも上る。エントリー向けのNVIDIA GeForce RTX 3050でさえも71TOPSである。ハードウェアのパフォーマンスだけでいえば十分だ。

 残念ながら、現状ではNVIDIA GPUのハードウェアリソースをMicrosoftが提供するローカルAIアプリで利用することはできない。しかし、将来的にはNVIDIAのGPUもWindows Copilot Runtime利用できるようになるよう、MicrosoftとNVIDIAが開発を進めており、2024年後半にプレビュー版をリリースする予定だという。

 なお、NVIDIAはこうした処理ができるdGPU搭載PCを独自に「RTX AI PC」と定義し、アピールしていく構えだ。

●リアルタイムでパーソナルなAI活用が解禁 しかも使い放題

 ローカルでAIを処理するのか、ということについてもフォローしておきたい。

 「サーバ側でAIが使えるなら、それでいいんじゃない?」と思う人がいるかもしれない。しかし、ローカルでAI処理を行う理由としては、リアルタイム性(レスポンス)、パーソナル(プライバシー)、サーバリソース(コスト)、電力効率などが挙げられる。

 リアルタイム性については、Windows Studio Effectsによるカメラ効果が分かりやすい例だ。カメラの映像をいちいちサーバに送ってAI処理をしていては遅すぎるし、ネットワークのトラフィックも膨大になってしまう。こうしたリアルタイムのAI活用はローカルAIでしかできない。

 また、個人情報などパーソナルなデータをサーバに送信しなくて良いというのもローカルAIのアドバンテージだ。リコールのような機能も(それでもセキュリティの課題はあるとはいえ)ローカルAIだからこそできることだ。

 サーバ側の負荷の問題もある。AIサーバの運用には膨大なコストがかかり、アクセスが集中すれば遅延やサービス停止のリスクもある。Dall-E 3による画像生成も1日に利用できる回数が制限されているように、回数制限や利用料金を課しているサービスは多い。その点、ローカルAIであれば、サーバの負荷は気にする必要がない。OSに統合されたMicrosoftのアプリであれば、無料で使い放題だ。

 サーバとの通信が不要な点は、電力効率についてもメリットがあるだろう。前述したように、AI推論用に特化したNPUのメリットと合わせれば、AIを活用する前提での電力効率のアドバンテージはかなりのものになると思われる。

●ついに登場したCopilot+ PC!

 6月18日から販売が開始されるCopilot+ PCの第1弾は、全てQualcommのSnapdragon Xシリーズを搭載している。Snapdragon Xは、Arm64アーキテクチャのCPUコアを搭載したSoC(System On Chip)であるので、少々注意も必要だ。

 Windows 11では32bitのx86アプリに加えてx64アプリのエミュレーション機能も搭載しているため、x86やx64アプリも大抵は動作するようになっているが、性能的にはネイティブ対応アプリに見劣る。

 ただ、Microsoftは既にTeams/PowerPoint/Outlook/Word/Excel/OneDrive/OneNoteといった主要アプリのArm64ネイティブ対応を済ませている。また、サードパーティー製品では、アドビのPhotoshop/Lightroom(Premiere Proは開発中)、ChromeやZoom、Blender(α版)、DaVinci Resolve(β版)などがネイティブ対応しており、今後増加していく見込みだ。

 なお、ドライバはエミュレーションできないので、Arm用のドライバが用意されていない周辺機器は動作しない。そのあたりの互換性やパフォーマンスについては、実機でのレポートで明らかになっていくだろう。ぜひ注目してもらいたい。

この記事の関連ニュース