1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

【現地取材】AIこそPixelの華、Geminiこそグーグルの軸。目指すはスマホの劇的な変化(西田宗千佳)

ASCII.jp / 2024年8月19日 13時20分

発表会が実施されたグーグル本社

 グーグルが「Pixel 9シリーズ」を中心とした自社デバイスを発表する「Made by Google」イベント取材のため、米マウンテンビューにあるグーグル本社を訪問した。

左から、Pixel 9 Pro、Pixel 9 Pro Fold、Pixel 9 Pro XL

 一般的にメーカーは、「発表まで製品を隠す」もの。リーク情報はあまり好ましいものではない。だがグーグルは、Pixelに関して発表のずいぶん前からデザインを「チラ見せ」するようになっている。特に今回はそうだ。

 バズが重要な時代となり、製品の情報が拡散することは販売戦略上重要な要素に変わっている。それを考えると、こうした流れも理解できるものだ。

 ただ、グーグルが「デザインを先に見せてもいい」と判断したのは、単にバズ重視だからではないようにも思う。

 彼らが考える「スマートフォンの劇的な変化」が、ハードのスペックではなく「サービスやAIとの連携」で生まれるようになっているからではないだろうか。

 実際、今回発表会では「AIとソフト」の力がアピールされた。それは確かにパラダイムシフトを予感させるものだったが、同時に視界の不透明さを感じさせる部分もあった。

AIでスマホのパラダイムシフトを

 グーグルでPlatforms & Devicesチームを統括するシニア・バイスプレジデントのリック・オステルロー氏は、現在のAndroidに起きている変化を「大きなパラダイムシフトの只中」と説明する。

 パラダイムシフトの中心にあるのは、もちろんAIだ。

Gemini活用が今回のテーマ

 グーグルは現在、同社のAIであるGeminiを軸に、Androidを再構築する過程にある。それはPixelシリーズ向けだけの話ではない。あらゆるAndroidデバイス向けに計画は進行中で、今回Pixel向けとして公開されたGeminiを使う新機能は、基本的に過去のPixelにも、他のAndroidスマホにも提供される。

よく見ると、ドロイドの周囲に「Gemini」を表すキラキラが。統合がテーマだからだ

 全ての機能ではないが、クラウドでの処理が中心となるもの(例えば、後述する「Gemini Live」など)については、iOS版アプリにも展開されるという。Geminiはグーグルのコアサービスであり、できるだけ幅広く提供する考え方なのだが、Androidについてはさらに統合を進める。

スマートフォンを構成する多層構造が連携し、AIの価値が生まれる

 その中でも、プロセッサーを含むハードウエアからソフトウエア、サービスまで、グーグルとしてのパッケージを示す存在がPixel、ということになるのだろう。

Tensor G4はさらに「AI推し」、変化の根幹にあるGemini Nano

 Pixelは、2021年発売の「Pixel 6」あたりから大きく変わった。グーグル開発のプロセッサーである「Tensor」シリーズを採用し、パフォーマンスに対する考え方を変えたためだ。

 Pixel 9シリーズも「Tensor G4」を搭載し、同じ考え方を踏襲する。CPU、GPUでわかりやすくハイエンドと並ぶ性能を目指すのではなく、AIの推論処理に求められる要素を強化する、いわゆる「NPU重視」路線だ。PCも含め、各社が「AI搭載」をいたうようになった現在、この方針は業界全体のトレンドになった、と言ってもいい。

差別化要因は「Tensor G4」

 Tensor G4の性能はまだ判然としない。だが、発表会の中でグーグルは、CPU性能もGPU性能もほとんど言及せず、AI推論の性能だけをアピールした。ということは、より「AI推し」ということなのだろう。

マルチモーダルAIを念頭に、Tensor G4はAI処理能力を強化している

 もちろん、一般的な性能自体も重視されている。発表会のキーノートでは言及がなかったものの、別途海外プレス向けに開かれた会見では、「ゲームは重要な要素であり、中でもPixel 9 Pro Foldでは画面の広さを活かして快適に遊べることを重視している」とコメントしていた。ハンズオン取材ではわかりにくいところなので、実機レビューのタイミングにでも確認したいところだ。

 Pixel 9で動作する「Gemini Nano」を活用した機能はもちろん、Tensor G4を生かしたものである。

Pixel 9で動作する「Gemini Nano」が戦略の軸

 特に目立つのは「英語」からスタートする新機能群だ。

 日本の視点で見ると、どうしても今回のPixel 9シリーズは「単価アップして性能アップした製品」に見えてくる。写真や動画関係の機能は相変わらずエグい進化だが、そこに興味がないと「またカメラか」と思うかもしれない。

カメラの機能はもちろん大幅に進化しているが……

 しかし実際には、「今年のPixelはカメラだけでなく普段使いのAI」が進化している。ただ残念なことに、その多くがまだ英語向けである……ということなのだ。時間はもう少し必要だろうが、これが日本語に対応してくるのは間違いない。

 特に大きいのは、通話音声を自動的に書き起こしてサマリーを作る「Call Notes」と、スクリーンショットに含まれる文字や内容を認識、検索・分類する「Pixel Screenshot」だろう。

 昨年から各社は「生成AI推し」だった。画像生成も翻訳もその成果であり、たしかに魅力的ではある。一方で、それらの機能を「毎日使う」という人は限られている印象も強い。しかし、通話機能の改善や情報の分類に類する機能は、より一般性があって多くの人に刺さる可能性が高い。

 これらはデバイス内で独立して動作するGemini Nanoを使う。理由はプライバシー保護だ。NPU重視の流れはほとんど、このためにあるようなものでもある。

通話をデバイス内でGeminiが書き起こし、サマリーを作る「Call Notes」
スクリーンショット内の文章・内容を認識、検索・分類する「Pixel Screenshot」
「Call Notes」や「Pixel Screenshot」はプライベートな情報なので、全てデバイス内で処理される

 さらに、こちらはクラウド処理になるが、音声での(ほぼ)リアルタイム対話を実現する「Gemini Live」もスタートした。これらを組み合わせると、以下の3つが同時に実現する。

 ・電話はメール並みに「確認して再利用可能なコミュニケーション手段」へ  ・スマホ内で起きたことはすぐ記録に残し、AIで検索して利用可能に  ・スマホは「常に画面をタッチしている」存在でなく、音声インタラクションがさらに活用される

 これがちゃんと実用的なレベルで可能なら、たしかにスマホの「パラダイムシフト」である。

グーグルはライバルに比べ有利、だからこそ気になる「独占」の行方

 もちろん課題は、「グーグルがいうとおりの動作をするのか」という点だ。

 どれも珍しい要素ではなく、過去にGoogleアシスタントが試みてきた方向性ではある。しかしそれがようやく、生成AIの力によって「実現するかもしれない」と感じられるタイミングになってきた。

 また、アップルやマイクロソフト、サムスンなども同じ方向性を狙っている。各社がいつ理想を実現するのか、そしてどこが一番良い使い勝手になるのかは不透明だ。もちろん、前出のように「日本語」を含む多言語対応の問題も大きい。

 ただ、AIが本格的に活用されるとすれば、そこでは「AIの技術がある」だけではなく、多様なサービスを持っていてAIをそこに組み込んでいけることや、多様なデバイスとの連携が必要になってくる。

 これができる企業は多くない。AIの開発自体にコストがかかることに加え、プラットフォームとしての強さも重要だ。すなわち、グーグルという企業は明らかに「AIをアシスタントとする戦略」に向いた特性を持つ、有利な立場なのだ。

 一方アメリカでは、グーグルに対して「分割議論」も出始めている。そうしたことがどう影響するのか、そろそろ考える時期に来たともいえそうだ。

 

 筆者紹介――西田 宗千佳  1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、書籍も多数執筆。テレビ番組の監修なども手がける。主な著書に「生成AIの核心:「新しい知」といかに向き合うか」(NHK出版)、「メタバース×ビジネス革命 物質と時間から解放された世界での生存戦略」(SBクリエイティブ)、「ネットフリックスの時代」(講談社)、「ソニー復興の劇薬」(KADOKAWA)などがある。

 

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください