Google I/O 2026発表内容まとめ。Gemini 3.5が発表
Image:Google
Googleは現地時間5月19日(日本時間20日早朝2時)、米カリフォルニア州マウンテンビューのショアライン・アンフィシアターにて年次開発者会議「Google I/O 2026」を開催した。
スンダー・ピチャイ CEOが登壇し、「Gemini」を中心としたAI関連発表が相次いだ。
例年と同様に多岐にわたる製品アップデートが披露されたが、今年の基調講演は例年以上にAIへの集中度が際立ち、Androidやハードウェアに割かれた時間は限定的だった。
Gemini 3.5 Flashが本日より提供開始
今回のI/Oにおける最大のハイライトは「Gemini 3.5」シリーズの発表だ。Googleはまず「Gemini 3.5 Flash」を即日リリースし、Geminiアプリ、Google SearchのAI Mode、開発者向けのGemini APIをはじめとする複数のGoogleサービス全体でデフォルトモデルとして採用することを明らかにした。
Gemini 3.5の特徴として、GoogleはフロンティアレベルのAI知性とエージェント的行動能力の両立を強調する。コーディング、エージェントタスク、マルチモーダル理解といった主要ベンチマークにおいて、前世代にあたるGemini 3.1 Proを上回る性能を達成しつつ、出力トークンあたりの速度は他のフロンティアモデルと比較して4倍速いとされる。単に速いだけでなく、知性を犠牲にせずに高速化を実現している点がGoogleの主張する差別化ポイントだ。また、長期にわたる複雑なエージェントタスク(long-horizon agentic tasks)を処理し、サブエージェントのチームを展開する基盤としても機能するよう設計されており、よりリッチでインタラクティブなウェブUIやグラフィックスの生成にも対応している。
一方、上位モデルである「Gemini 3.5 Pro」については現在社内でテスト中であり、来月リリース予定と予告するにとどまった。今回の発表でモデルファミリーとして「Gemini 3.5」の存在が正式に確立されたことは、今後の製品展開を占う上で重要な意味を持つ。
マルチモーダル動画生成モデル「Gemini Omni」
Geminiモデルファミリーの新たな一員として、マルチモーダルな動画生成に特化した「Gemini Omni」が発表された。
昨年リリースされたVeo 3がテキストから動画を生成することに注力していたのに対し、Omniは画像、音声、動画、テキストのあらゆる組み合わせを入力として受け取り、動画コンテンツを出力する。Geminiが蓄積してきた現実世界に関する知識を基盤とした動画生成が可能であり、生成された動画は自然言語による会話を通じて後から編集することもできる。重力、流体力学、運動エネルギーに関する物理的な理解に基づく、より精緻な映像表現が可能になったとされる。
本日即日利用可能となる「Gemini Omni Flash」はその初号モデルであり、GeminiアプリのPlusプラン、AIプロ、AI Ultraの有料サブスクライバーが利用できる。Demis Hassabis Google DeepMind CEOは、Omniは将来的に動画だけでなく、あらゆる入力からあらゆる出力を生成できるモデルへと発展させていく意向を示した。コンテンツクリエイターや研究者にとって、視覚的な説明資料の作成やメディア制作において強力なツールになり得る。ただし、動画の無断改変などへの悪用リスクも伴うことは留意が必要だ。
24時間365日稼働するパーソナルAIエージェント「Gemini Spark」
今回の発表の中でも特に注目を集めたのが、パーソナルAIエージェント「Gemini Spark」だ。Googleは「GeminiをAI質問応答ツールから、実際の作業を代行する能動的なパートナーへと変革する大きな転換点」と位置づけている。
Gemini SparkはGoogleクラウド上の仮想マシンで動作し、ユーザーがデバイスを使用していない間も24時間365日バックグラウンドで稼働し続ける点が従来のアシスタントと根本的に異なる。毎月のクレジットカード明細を自動的に解析して不審な手数料や新規サブスクリプションを検出したり、学校からの通知メールを監視したりといった、継続的かつ複数ステップにわたるタスクの自動化が可能だ。
現時点ではGmail、Docs、SlidesといったGoogle Workspaceアプリとの統合が実装されており、さらにCanva、OpenTable、Instacartといったサードパーティアプリとも連携する。近日中にMCP(Model Context Protocol)サポートを通じてさらに多くのサードパーティアプリへの対応を広げる予定だという。将来的にはテキストメッセージや電子メールでSparkに直接指示を出したり、ユーザー独自のサブエージェントを作成したり、ローカルブラウザを操作させる機能も計画されている。
Gemini Sparkは来週よりアメリカのGoogle AI Ultraサブスクライバーを対象に提供が始まり、今夏中にChromeとの連携機能も追加される見込みだ。
Geminiアプリが全面リニューアル。Sparkの900万人超活用も話題に
GeminiアプリそのものもI/O 2026に合わせてデザインが刷新された。「Neural Expressive」と呼ばれる新しいデザイン言語が採用され、流体的なアニメーション、鮮やかな色使い、ハプティックフィードバック、新しいタイポグラフィが特徴で、本日よりデスクトップ、iOS、Androidに順次展開される。操作性の面でも、モバイル版ではプロンプト入力欄がピル形状に改められ、左側に単一の「+」ボタンが配置されてToolsメニューなどをシンプルにまとめている。
Gemini Liveは全画面表示を廃止し、モード切り替えなしにインラインで使えるようになった。また、Geminiが返答をデザインする際に最も重要な情報を先頭かつ太字で表示し、インライン画像、ナレーション付き動画、タイムライン、インタラクティブなビジュアライゼーションを活用するようになる。
Sundar PichaはGeminiアプリの月間アクティブユーザーが9億人を超え、過去1年間で2倍の成長を遂げたと述べた。また毎月9.7兆トークンが処理されているというデータも開示され、Geminiエコシステムの急速な拡大ぶりが改めて示された。
加えて、Geminiアプリにはパーソナライズされた「Daily Brief」エージェントが追加される。各種Googleサービスから情報を収集し、1日の概要を提供するエージェントで、本日より有料サブスクライバーへの展開が始まる。
Google SearchがAIへと全面移行。25年来最大の刷新
今回のI/Oでは「Google Search is AI Search」というメッセージが明確に打ち出された。AI ModeはGemini 3.5 Flashをデフォルトモデルとして採用し、本日より全世界で展開される。
検索ボックス自体も25年以上ぶりの大幅刷新を迎えた。入力内容に応じて動的に拡張する新しい検索ボックスは、より長く会話的なクエリにも対応し、オートコンプリートを超えたAI搭載の提案機能でユーザーの意図を先読みする。テキスト、画像、ファイル、動画、Chromeタブを入力として横断的に検索できるマルチモーダル対応も実装される。
さらに、AIエージェントがバックグラウンドで24時間365日稼働し、ウェブ上のブログ、ニュースサイト、SNSの投稿に加え、金融、ショッピング、スポーツのリアルタイム情報を常時監視してユーザーに通知する「情報エージェント」機能も発表された。この機能は今夏よりGoogle AIプロおよびUltraサブスクライバーに提供される。Googleはまた、コーディングツールのAntigravityとGemini 3.5 Flashのエージェント機能をSearchに統合し、検索結果として対話的なビジュアルツール、シミュレーション、ダッシュボードをリアルタイムで生成するGenerative UI機能も今夏に無料で展開する予定だ。
コーディングツール「Antigravity 2.0」が全世界に公開
Googleのコーディング支援ツール「Antigravity」のバージョン2.0がリリースされた。Gemini 3.5 Flashを搭載したことにより、従来比12倍の高速化が実現されており、トークンの最適な活用も図られている。エージェント優先設計の新しいデスクトップアプリとして提供され、OSの作成支援のデモでは「Doom」が動作するまでの工程が披露された。Antigravity 2.0は本日より全世界向けに無料で提供される。
AIスマートグラス、2026年秋に発売へ
基調講演の終盤では、Googleが力を入れる拡張現実デバイスの最新動向も明かされた。SamsungとGoogleの共同開発による「Android XR」プラットフォームを搭載したインテリジェント・アイウェアの第一弾が、2026年秋に発売されることが発表された。
今回披露されたのは音声中心の設計で、ディスプレイは搭載されないいわゆる「スマートグラス」形態だ。カメラ、スピーカー、マイクを内蔵し、Gemini AIを常時利用できる点はMetaのRay-Ban Meta AIグラスと類似した方向性といえる。フレームのデザインはアメリカの眼鏡ブランドWarby ParkerおよびKorean luxuryブランドGentle Monsterが手がけており、ハードウェアエンジニアリングはSamsungが主導、AIソフトウェアはGoogleが担う形で役割分担されている。AndroidとiOSの両方のデバイスと連携する。
マップ機能との統合、Doordashを活用したコーヒー注文の自動化といったデモも披露された。ディスプレイを搭載したより高機能なXRグラスについては今後の発表として留保された形となった。
Gemini for Science、AIコンテンツ検出など追加発表
その他にも多くの発表が相次いだ。Googleは科学研究を支援する「Gemini for Science」を発表し、ハリケーン予測などの研究支援ツール群に加え、共同研究者としてのAI「Co-Scientist」の提供を開始する。
AI生成コンテンツの透明性確保に向けては、Gemini及びChromeへのC2PA(Content Provenance and Authenticity)コンテンツ認証情報の統合が発表された。ユーザーはChromeブラウザ上で画像を右クリックしてGeminiに「この画像はAI生成か」と問い合わせることができるようになる。OpenAIなど他の企業もこのコンテンツ検証の仕組みに参加する予定だとGoogleは明らかにした。
クリエイター向けには、「Google Flow」もアップデートされた。GeminiのAI創作スタジオとして複数のアクションを同時に実行するAIエージェント機能、カスタムツールを作成できる「Flow Tools」が加わり、Gemini Omniとの統合も実現した。
ショッピング面ではGoogleサービス全体をまたいで機能するAI搭載の「Universal Cart」が発表され、Search、GeminiアプリでのAIショッピング統合が実現する。YouTubeでは「Ask YouTube」が登場し、ユーザーの質問に基づいてAIが関連動画を自動的に探し出す機能が提供される。
macOS向けGeminiアプリでは、FinderでファイルやドキュメントをまとめてGeminiに渡し、ボイスコマンドで一括処理させる機能が追加される予定だ。今夏中にはGemini Sparkとの連携も実装される。
サブスクリプション料金を改定。Gemini API利用者向けには新モデル群を即日提供
料金面では、Google AI Ultraプランの下限が月額250ドルから月額100ドルに引き下げられた。新しい100ドルプランはAI Proプランの5倍のGeminiアプリ利用枠を備え、従来の250ドルプランと同等の機能を持つ200ドルプランも引き続き提供される。
開発者向けには、Gemini 3.5 FlashおよびGemini Omni FlashがGemini APIを通じて本日より即日利用可能になった。Gemini Sparkで採用される長期エージェントタスクの処理能力、マルチモーダルな動画生成機能を自社サービスに組み込みたい開発者にとって、すぐに実験を開始できる状況が整ったことになる。
Appleとの提携を正式確認。SiriをGeminiが強化へ
今回のI/O期間中には、Geminiの勢力拡大を象徴する別の動きも明らかになった。Googleクラウド部門のトップ、Thomas Kurian氏がラスベガスで開催中のGoogle Cloud Next 2026において、GeminiがAppleのSiriを強化する新バージョンを後押しすることを正式に確認した。SiriのGemini統合バージョンは2026年中のリリースが予定されており、実現すれば世界中のiPhoneにGeminiの知性が届くことになる。
Google I/O 2026は、Geminiを単なるチャットAIから「デジタルライフを管理するエージェント」へと進化させることを明確に打ち出した場となった。Gemini 3.5 Flashの即日公開、エージェントとして常時稼働するGemini Spark、任意入力から動画を生成するGemini Omni、そして検索体験の根本的な再設計と、発表のスケールは例年を大きく超えるものだった。秋のAndroid XRスマートグラス発売、翌月予定のGemini 3.5 Proリリース、そしてAppleとのSiri統合など、今後数か月間もGoogleのAI展開から目が離せない状況が続く。
引用:Google
https://blog.google
Share this content:



コメントを送信