// GEMINI 3.5 FLASH — DEEP DIVE

Gemini 3.5 Flash 完全解説

Flash が前世代 Pro を超えた歴史的転換点

Google が 2026年5月19日の I/O 2026 で発表した Gemini 3.5 Flash。「Flash」と名がつきながら、Terminal-Bench 76.2%・MCP Atlas 83.6% で前世代フラッグシップの Gemini 3.1 Pro を上回る性能を達成。価格 $1.50/$9.00・4倍高速・1M コンテキストで「コスト最適 × 性能最強」のポジションを確立しました。本記事ではベンチマーク・競合比較・Antigravity 2.0・日本企業向け活用までを徹底解説します。

⚡ 2026-05-19 GA 🏆 Flash が Pro 超え 💰 $1.50/$9.00 per 1M 🌐 1M コンテキスト ⚡ 4倍高速

⚡ 30秒サマリ

リリース日 2026年5月19日(Google I/O 2026 で発表)
モデル種別 Gemini 3.5 シリーズ第1弾(Flash 系・速度最適化型)
価格 Input $1.50 / Output $9.00 / Cached $0.15(per 1M tokens)
コンテキスト 入力 1,048,576 トークン(約1M)/ 出力 65,536 トークン(64K)
速度 他のフロンティアモデル比 4倍高速(output tokens/sec ベース)
マルチモーダル 入力: テキスト・画像・音声・動画・PDF / 出力: テキストのみ(画像・動画生成は別モデル Gemini Omni の役割)
知識カットオフ 2026年1月(公式モデルカード未確認・ソース間で2025年1月との記述もあり要照合)
主要提供 Gemini API(AI Studio・Android Studio)/ Google Antigravity 2.0 / Gemini Enterprise

🎯 Gemini 3.5 Flash とは? — I/O 2026 の主役

Google I/O 2026(2026年5月19日)の基調講演で発表された Gemini 3.5 シリーズ第1弾。「Flash」は Gemini ファミリーで速度・コスト効率を最重視する系列で、これまで Flash は Pro より性能が一段下のポジションでした。

しかし今回の 3.5 Flash は、複数ベンチマークで前世代の Gemini 3.1 Pro を上回るという、Gemini ファミリー史上初の現象が起きました。これは単なるバージョンアップではなく、「アーキテクチャ・学習効率の改善が、単純なモデル巨大化を凌駕した」ことを意味します。

Google は同時に Gemini Omni(動画生成)、Gemini Spark(24時間稼働エージェント)、Google Antigravity 2.0(エージェント開発プラットフォーム)、AI Ultra プラン値下げ($250 → $200)+ 新 $100/月 Ultra tier 新設(Pro 比 5倍の利用上限、開発者・パワーユーザー向け)等を発表し、AI エージェント時代への本格シフトを打ち出しました。

📊 ベンチマーク詳細

Google が公表した主要4ベンチマークで、Gemini 3.5 Flash は前世代 Gemini 3.1 Pro を上回る結果を示しました。

Terminal-Bench 2.1

コーディング 76.2%

実環境ターミナル上での長時間コーディングタスクの完遂率。Gemini 3.1 Pro を超えた

GDPval-AA

実世界エージェント 1656 Elo

経済価値生成タスクのエージェント性能。Elo レーティングで定量化

MCP Atlas

ツール使用 83.6%

Model Context Protocol 経由のツール使用信頼性。Anthropic 提唱の MCP がベンチマーク化されたのが象徴的

CharXiv Reasoning

マルチモーダル理解 84.2%

科学論文中のチャート・図表を読解する推論力

※ 各ベンチマークは Google 公式発表値。第三者検証では数値が異なる可能性があります。CharXiv は学術界で標準的なマルチモーダル推論ベンチマーク、MCP Atlas は Anthropic 提唱の Model Context Protocol を採用したツール使用評価で、競合プロトコルを Google が公式ベンチマークに採用した点が業界的に注目されています。

🏆 「Flash が Pro を超えた」歴史的意義

AI モデルの命名規則として、Gemini の「Flash」は速度・コスト効率を最重視する系列で、これまで Pro(性能重視)の下位ポジションでした。OpenAI の「mini」、Anthropic の「Haiku」と同様の位置付けです。

今回 3.5 Flash が 3.1 Pro を超えたのは エージェント・コーディング・マルチモーダル理解の領域に限定される点に注意(Terminal-Bench / GDPval-AA / MCP Atlas / CharXiv で逆転)。純粋推論(Humanity's Last Exam 40.2% vs 44.4%)や ARC-AGI-2(72.1% vs 77.1%)では依然 Gemini 3.1 Pro が優位。それでも実務系ベンチで Flash が前世代 Pro を上回ったことは以下を示唆します:

  • スケーリング則の限界: 「単にモデルを大きくすれば性能が上がる」時代の終わりが見え始めている。アーキテクチャ最適化・学習効率改善・データキュレーションが新しいフロンティア
  • 推論コストの劇的低下: 同等性能を従来の半分以下のコストで提供できる時代。AI の業務導入の費用対効果が一段上がる
  • 速度がエージェント時代の鍵: 4倍高速は、複数サブエージェントを並列で走らせるエージェントオーケストレーションで決定的に効く
  • 1M コンテキスト + 高速 + 低価格 の3点セット: 大規模 RAG・大量バッチ処理・長時間自律エージェント等、これまでコストで実現不可能だったユースケースが現実的に

Anthropic の Claude 4.6 Sonnet が Opus に近い性能で 1/5 価格を実現したのも同じトレンド。2026年は「中堅モデルがフロンティアを更新する」年と言える状況です。

🆚 主要モデル比較(2026年5月時点)

Gemini 3.5 Flash を Claude / GPT 系の主要モデルと比較。価格・コンテキスト・強みで一覧化します。

モデル リリース 入力単価 出力単価 Ctx (入/出) 強み
Gemini 3.5 Flash 2026-05-19 $1.50 $9.00 1M / 64K コーディング・エージェント・速度・コスト
Gemini 3.1 Pro 2026-02-19 $2.00 $12.00 2M / 64K 前世代フラッグシップ(純粋推論・ARC-AGI-2 では依然強い)
Claude Opus 4.7 2026-04-16 $5.00 $25.00 1M / 64K 長文推論・複雑タスク・SWE-bench 64.3%・Computer Use
Claude Sonnet 4.6 2026-02-17 $3.00 $15.00 1M / 128K バランス型・コーディング・MCP 連携
GPT-5 2025-08-07 $5.00 $30.00 400K / 128K 汎用性・対話品質
GPT-5.5 2026-04-23 $5.00 $30.00 1.05M / 128K Terminal-Bench 82.7%(3.5 Flash の 76.2% より上)・推論強化

※ 単価は per 1M tokens。各社の値下げ・改定が頻繁にあるため、実装時は各社公式の最新価格を確認してください。コンテキストウィンドウは「入力/最大出力」表記。

💡 コスト×性能の評価: Gemini 3.5 Flash は出力単価 $9.00 が Claude Opus 4.7 ($25.00) の 約 1/2.8、GPT-5.5 ($30.00) の 約 1/3.3。Anthropic は Opus 4.7 で前世代比 output 価格を 67%($75→$25)大幅値下げしており、フロンティアモデルのコスト破壊競争が激化している。Terminal-Bench では GPT-5.5 (82.7%) > Gemini 3.5 Flash (76.2%) > Claude Opus 4.7 (64.3%) の順だが、Opus 4.7 は SWE-bench Pro 64.3% で他を圧倒し、Computer Use や複雑なマルチファイル リファクタでは依然強い。「速度と低コストで大量処理」なら Flash、「最高品質の長文推論・Computer Use」なら Opus 4.7、「Terminal-Bench トップ性能」なら GPT-5.5と使い分けるのが2026年5月時点の最適解。

🔌 提供チャネルと活用環境

Gemini 3.5 Flash は複数の経路で提供されます。特に注目すべきは Google Antigravity 2.0(エージェント開発専用デスクトップアプリ)と、ISMAP 登録済みの Gemini Enterprise

Gemini API(Google AI Studio)

開発者向けエンドポイント。GA 提供開始。Managed Agents 機能も同時導入

主な用途: 個別アプリ・API 統合

Android Studio

Android 開発統合 IDE 内で Gemini 3.5 Flash を利用可能

主な用途: モバイル開発支援

Antigravity 2.0(スタンドアロン デスクトップアプリ)

エージェント開発専用デスクトップアプリ。複数サブエージェント並列実行・動的タスク委任・スケジュール機能。Gemini 3.5 Flash と Gemini 3 Pro が分離 Linux 環境で連携動作(マルチモデル構成)

主な用途: エージェント開発・自律タスク実行

Antigravity CLI(Go 製・Gemini CLI のリプレース)

旧 Gemini CLI を完全リプレース。Go 製で軽量・高速。消費者向け Gemini CLI と Code Assist IDE 拡張は 2026年6月18日に終了予定 — 既存利用企業は Antigravity への移行必須

主な用途: CLI ベース AI 開発・スクリプト統合

Antigravity SDK

カスタムエージェント・サブエージェント・ツールを実装する SDK

主な用途: 社内エージェント開発

Gemini Enterprise Agent Platform

企業向けエージェント運用プラットフォーム。ISMAP 登録済み(日本政府調達対応)

主な用途: 企業の業務エージェント

Gemini Enterprise

汎用エンタープライズ Gemini プラットフォーム

主な用途: 企業の文書処理・分析

Gemini アプリ・Google Search AI モード

一般ユーザー向け。一部機能は無料公開

主な用途: 日常タスク・検索

🚀 Google Antigravity 2.0 の革新性と注意点

I/O 2026 で同時発表された Antigravity 2.0 は 5面構成(デスクトップアプリ / CLI / SDK / Gemini API Managed Agents / Gemini Enterprise Agent Platform)の包括的エージェント基盤。エージェントは Gemini 3.5 Flash と Gemini 3 Pro が分離 Linux 環境で連携動作(マルチモデル構成)し、Claude Computer Use・OpenAI Operator・Devin 等と競合する位置付け。

⚠️ 重要 — 既存 Gemini CLI 利用企業は移行必須: 旧 Gemini CLI と Code Assist IDE 拡張は 2026年6月18日に消費者向け提供終了。Antigravity CLI(Go 製)が後継。業務システムに Gemini CLI を組み込んでいる企業は早急な移行計画策定が必要。

💼 ユースケース別の使い分け

🤖

AI エージェント開発

Antigravity 2.0 と組み合わせ、複数サブエージェントの並列実行・スケジューリングが可能。Terminal-Bench 76.2% は長時間自律タスクで威力を発揮

⌨️

コーディング支援

GitHub Copilot・Claude Code・Cursor 等との比較で「コスト最適 + 速度最強」のポジション。1M コンテキストで大規模リポジトリ全体を一度に処理可能

🖼️

マルチモーダル分析

テキスト・画像・音声・動画 すべて入力対応。CharXiv 84.2% は論文図表・グラフの読み取りで上位。教育・研究・医療画像分析に向く

大量処理(バッチ系)

4倍高速 + キャッシュ $0.15/1M により、数千件規模の処理で圧倒的なコスト性能。Claude Opus 4.7 ($5/$25) 比で出力単価 約 1/2.8、GPT-5.5 比 約 1/3.3。さらに非グローバルリージョン(日本含む)は $1.65/$9.90 と若干高めなので調達時要確認

🔌

MCP ベース ツール統合

MCP Atlas 83.6% は MCP 経由の外部ツール呼び出し精度。Anthropic 提唱の MCP が Google ベンチマークに採用された点が象徴的

🏢

日本企業のエンタープライズ導入

Gemini Enterprise は ISMAP 登録済みで政府調達・金融機関等にも採用可能。3.5 Flash の高速・低コスト特性は社内文書処理・コールセンター AI 等に好相性

⚠️ Gemini 3.5 Flash の弱点・注意点

「Flash が Pro 超え」は強力なメッセージですが、全領域で最強というわけではありません。導入検討時に把握しておくべき弱点:

  • SWE-bench Pro は 55.1% — Claude Opus 4.7(64.3%)・GPT-5.5(58.6%)に劣る。複雑なマルチファイル リファクタリング案件では Opus 4.7 が依然優位
  • Computer Use 機能なし — 画面操作・ブラウザ自動化等のエージェントタスクは Claude Computer Use(Anthropic)や OpenAI Operator が選択肢になる
  • 出力はテキストのみ — 画像・動画・音声生成は不可。それぞれ Gemini Omni(動画)・Imagen(画像)・ElevenLabs 等の別モデルが必要
  • 純粋推論ベンチマークは前世代 Pro が優位 — Humanity's Last Exam・ARC-AGI-2 では Gemini 3.1 Pro の方が高スコア
  • Terminal-Bench では GPT-5.5 が上 — 82.7% vs 76.2%。GPT-5.5(2026年4月23日 GA、$5/$30、1.05M context)も同価格帯の競合として有力
  • 非グローバルリージョン価格(日本含む)は若干高め — Input $1.65 / Output $9.90。グローバル価格との差を調達時に確認推奨
  • 同時発表モデル群との使い分けが複雑 — Gemini 3.5 Flash(汎用)/ Gemini Omni(動画生成)/ Gemini Spark(24時間エージェント)の役割整理が必要

🔮 6月リリース予定 — Gemini 3.5 Pro

Google は公式発表で 「Gemini 3.5 Pro は内部で既に使用中。来月(2026年6月)のロールアウトを予定」と明言。3.5 Flash が前世代 Pro を超えた現在、3.5 Pro が Claude Opus 4.7 / GPT-5 のフロンティア性能を更新する可能性が高いとの観測が広がっています。

想定される改善ポイント: ①長文推論性能のさらなる強化(Claude Opus 4.7 の領域)、②複雑な計画立案・多段階推論、③より大きなコンテキスト(2M〜5M トークン?)、④Gemini 3.5 Flash と組み合わせた hybrid 推論(Pro が計画、Flash が実行)。本サイトでは Gemini 3.5 Pro リリース後、速やかに比較記事を公開予定。

📚 関連記事

出典

本記事は 2026年5月23日 時点の Google 公式発表・第三者検証記事をもとに執筆。価格・ベンチマーク・提供チャネルは変更の可能性があるため、実装前に Gemini API 公式ドキュメント で最新情報をご確認ください。

// SPONSORED · 関連サービス

この記事を読んだ方におすすめ

ChatGPT / Claude / Gemini を1画面で

天秤AI Biz

主要AIを同時に呼び出して回答を比較できるビジネス向けプラットフォーム。本記事の比較を実機で試したい方に。

  • 主要AI (GPT-5.5・Claude・Gemini等) を1画面で並列比較
  • チーム共有・ログ管理・セキュリティ対応
  • 無料試用可
天秤AI Biz を無料で試す →
SEO 記事を AI で量産

Value AI Writer

高品質モデル対応の AI ライティング。ブログ・コンテンツ事業者向けに、月額1,650円から記事生成を自動化。

  • 最新 AI モデル対応で高品質出力
  • WordPress 直接投稿対応
  • 5日間無料トライアル
Value AI Writer を試す →