// AI MODEL CHANGELOG
AIモデル更新ログ
ChatGPT / Claude / Gemini を中心とした主要 AI モデルのリリース・大型アップデートを日付順に記録。 2023年12月の Gemini 1.0 から、2026年5月時点の最新版まで、業界の動きを一覧で追えるアーカイブです。
Claude速報も自動追跡中
Anthropic の公式 X ポストから Claude の最新アップデートを日本語要約 →
⏬ 新しい順 に並んでいます。最新リリースには 現行 マークを付与。 各社の進化の流れを俯瞰したい場合は、各ベンダー別の進化史記事もご覧ください。
💡 ちなみに: リリースだけでなく「Claude Code 品質低下ポストモーテム (4/23)」のような障害・品質低下の公式報告も本ログの対象です。 各社の透明性の差は AIベンダー透明性比較 で詳しく解説しています。
📡 RSS フィードで購読する🗓️ リリース・更新タイムライン
Claude Code レート制限2倍 + SpaceX「Colossus 1」提携で計算資源を大幅増強
Pro/Max/Team/Enterprise 全プランの5時間レートリミットを2倍に拡大。Pro/Maxのピーク時間帯制限を廃止。Anthropic が SpaceX と計算インフラパートナーシップを締結し、「Colossus 1」データセンターの 300MW(NVIDIA GPU 22万台超)を1ヶ月以内に追加展開。チャットからエージェント利用へのシフトで逼迫していた計算資源問題を一気に解消。
→ 詳細・進化史を見るClaude API が WIF(Workload Identity Federation)に対応 — 静的 API キー不要に
CI/CD パイプラインや本番環境から「sk-ant-」で始まる長期有効な静的 API キーを排除可能に。AWS IAM / Google Cloud / GitHub Actions / Kubernetes / Okta / Microsoft Azure 等の OIDC トークンで短命認証を実現。漏洩リスクをゼロにしつつ、ローテーション運用コストも削減。
→ 詳細・進化史を見るClaude Security パブリックベータ公開 — AI によるコード脆弱性スキャン&自動パッチ
コードベース全体をセマンティック解析し、ファイル間の依存・データフローまで追跡して脆弱性を検出。信頼度スコア+攻撃シナリオ付きで偽陽性を大幅削減し、修正パッチを Claude Code セッションで直接適用可能。Enterprise 限定。Slack/Jira Webhook 対応。
→ 詳細・進化史を見るClaude Code Week 17: /ultrareview パブリックプレビュー・Web UI 刷新・カスタムテーマ
v2.1.114〜v2.1.119 リリース。①/ultrareview がパブリックリサーチプレビューへ(クラウド上のバグ検出エージェントフリートが PR をスキャン)②セッションリキャップ(フォーカスを外して戻ると自動要約)③カスタムカラーテーマ(/theme コマンドで構築・配布)④claude.ai/code の Web UI 刷新(セッションサイドバー・ドラッグ&ドロップレイアウト)。
→ 詳細・進化史を見るGemini Enterprise・NotebookLM Enterprise が ISMAP 登録完了
日本政府向けセキュリティ評価制度「ISMAP(政府情報システムのためのセキュリティ評価制度)」の基準を満たし本登録完了。中央省庁・地方自治体・政府関連機関での正式調達が可能に。既登録サービス(Google Cloud / Workspace / AppSheet / Firebase / Looker Data Platform)に AI サービスが初めて加わった。運営はデジタル庁・総務省・経産省・国家サイバー統括室が共同で担当。
→ 詳細・進化史を見るGPT-5.5 / GPT-5.5 Pro リリース
マルチステップ推論・ツール使用・コーディング・文書作成の agentic 性能を強化。GPT-5.5 Pro / Thinking バリアントも提供。
→ 詳細・進化史を見るClaude Code 品質低下ポストモーテム公開
3/4-4/20 の品質低下報告について Anthropic が公式調査結果を公開。3つの問題を特定: ①推論努力 High→Medium への変更 (3/4-4/7、後に xhigh にリセット)、②セッションキャッシュ過剰クリアのバグ (3/26-、モデルが健忘・反復化)、③冗長性削減指示によるコード品質低下 (4/16-4/20)。Sonnet 4.6 / Opus 4.6 / 4.7 が影響、API は無影響。全サブスクライバーの使用制限がリセットされた。
Claude Opus 4.7 GA
SWE-bench Pro 53.4%→64.3%、CursorBench 58%→70%。Vision 解像度3倍。Claude Design 同時発表。
→ 詳細・進化史を見るClaude Mythos プレビュー発表
サイバーセキュリティ脆弱性発見の Project Glasswing を11社・組織に限定公開。
GPT-5.4 / 5.4 Thinking / 5.4 Pro リリース
初の汎用「コンピュータユース」搭載モデル。スクリーンショットを見てクリック・タイプ・ナビゲーションを実行可能に。
→ 詳細・進化史を見るGPT-5.3 Instant + Mini 刷新
会話自然性で 5.1 を上回り Instant Mini も同時刷新。Free 層への新モデル提供が標準化。
Gemini 3.1 Flash Lite リリース
Google AI API に Flash Lite 提供。3.1 シリーズ低コスト版で軽量タスク向け。
→ 詳細・進化史を見るGemini 3.1 Pro リリース
ARC-AGI-2 で 77.1%(3 Pro の倍以上)、LMArena #1。Reasoning 96.3 / Knowledge 94.8 / Coding 93.5 と全方位トップクラス。
→ 詳細・進化史を見るSonnet 4.6 リリース
1Mトークン コンテキストを標準価格で提供(β ヘッダ不要)。Sonnet が前世代 Opus を初めて超える。
→ 詳細・進化史を見るGPT-5.3-Codex リリース
コーディング特化の Codex バリアント。
Opus 4.6 リリース
agentic search 高速化、トークン効率改善。バランス型へのポジショニングシフト。
GPT-5.2-Codex リリース
コーディング専用バリアント。
Gemini 3 Flash リリース
3 Flash が Gemini アプリのデフォルトに。「PhD レベルの推論」を高速・低コストで提供。
GPT-5.2 リリース
会話のトーンが文脈に応じて自動調整。Instant の人格を更新。
Gemini 3 Deep Think Ultra ロールアウト
AI Ultra ($250/月) 加入者に並列思考モードのロールアウト開始。
Opus 4.5 リリース
コーディング・ツール使用の総合性能を Opus 4.1 から大幅改善、当時最強フロンティア。
Gemini 3 Pro / 3 Deep Think 発表
世代刷新。並列思考 (Deep Think) で ARC-AGI-2 大幅スコア向上。
GPT-5.1 (Instant / Thinking / Pro) リリース
動的 Reasoning 切替。Instant が難問で自動的に Reasoning 起動。
Haiku 4.5 リリース
低コスト・高速バリアントが Sonnet 4 同等性能に。
Sonnet 4.5 + Claude Code 2.0 リリース
SWE-bench Verified 77.2% — 当時の業界最高記録。Claude Code 2.0 同時リリース。
→ 詳細・進化史を見るGPT-5.0 リリース
通常応答と Reasoning を1モデルに統合。タスク難易度に応じて思考時間を自動調整。
Opus 4.1 リリース
Claude 4 シリーズの初の小規模アップデート。安定性・ツール使用の信頼性向上。
Gemini 2.5 Pro/Flash GA + Flash-Lite
2.5 系全ライン GA、Flash-Lite 追加。LMArena Elo 1470 と総合トップへ。
Claude 4 (Sonnet 4 / Opus 4) リリース
世代刷新。命名規則も「Claude 3.5 Sonnet」→「Claude Sonnet 4」へ。
Gemini 2.5 Flash プレビュー
Flash 高速版にも thinking 能力搭載。
GPT-4.1 / mini / nano リリース
API 専用で1Mトークン コンテキスト本番運用可能に。GPT-4o を完全リプレース。
Gemini 2.5 Pro Experimental
「thinking model」フラッグシップ発表、Reasoning 能力を内蔵。
GPT-4.5 リリース
GPT-4 と GPT-5 の架け橋となる大規模モデル。コスト効率の悪さから2025/7に終了の短命。
Claude 3.7 Sonnet リリース
初の「ハイブリッド推論」モデル。Extended Thinking モードを搭載。
Gemini 2.0 Pro Experimental + Flash Thinking
Reasoning モードと Pro 系統を強化。
o3-mini リリース
o3 系統の小型版を先行公開、Plus / Free にも展開。無料層に Reasoning が解放。
Gemini 2.0 Flash Experimental
「agentic era」宣言。ネイティブ画像生成・音声 TTS のマルチモーダル出力を実現。
o1 GA + ChatGPT Pro $200
o1 のフルバージョン GA、月額200ドルの Pro プラン新設。
Claude 3.5 Sonnet (new) + Haiku 3.5
「Computer Use」発表、エージェント機能の先駆けに。
o1-preview / o1-mini 発表
応答前に長く推論する Reasoning モデル系統が誕生。
GPT-4o mini リリース
低コスト高速バリアント。GPT-3.5 Turbo を完全置換。
Claude 3.5 Sonnet リリース
中位 Sonnet が前世代 Opus を超える衝撃。Artifacts 同時導入。
Gemini 1.5 Flash + Advanced 拡大
Google I/O で Flash 発表、Project Astra 予告。
GPT-4o (Omni) リリース
テキスト・画像・音声を単一アーキテクチャで処理。
Claude 3 (Haiku/Sonnet/Opus) リリース
3階層を初めて整備、エンタープライズ採用が一気に加速。
Gemini 1.5 Pro プレビュー
1Mトークン コンテキストを業界初投入。
Gemini 1.0 (Ultra/Pro/Nano) 発表
Bard / Duet AI を「Gemini」ブランドに統一。3階層を発表。
Claude 2.1 リリース
200K コンテキスト、Tool Use ベータ、ハルシネーション-50%。
GPT-4 Turbo 発表 (DevDay)
128K コンテキスト、JSON モード、GPTs / Custom GPT 同時公開。
🏁 ここから読み取れる構図
2024年は「マルチモーダル元年」
※ マルチモーダル=テキストだけでなく画像・音声・動画など複数のメディアを同時に扱える能力のこと。
GPT-4o(5月)/ Claude 3.5 Sonnet(6月)/ Gemini 1.5 Pro(2月)と、各社がマルチモーダル対応と長文処理を一気に実装した。テキスト中心の AI から、画像・動画・音声を扱う AI への転換点。
2025年は「Reasoning と統合」
o1(2024年9月)の登場以降、Reasoning(推論モード)が標準化。GPT-5 で通常/推論を統合し、ユーザーが「どのモデルを選ぶか」を意識しなくて良くなった。Claude 4 / Opus 4.5 もこの流れに追随。
2026年は「agentic era の本格化」
GPT-5.5(4月)/ Opus 4.7(4月)が同月に登場、両者ともにエージェント能力(マルチステップでツールを使い分けて成果物を完成させる)を強調。Anthropic は Claude Mythos でセキュリティ研究エージェントも公開。「答える AI」から「仕事をする AI」へ。
// SPONSORED · 関連サービス
この記事を読んだ方におすすめ
天秤AI Biz
主要AIを同時に呼び出して回答を比較できるビジネス向けプラットフォーム。本記事の比較を実機で試したい方に。
- ✓主要AI (GPT-5.5・Claude・Gemini等) を1画面で並列比較
- ✓チーム共有・ログ管理・セキュリティ対応
- ✓無料試用可
Value AI Writer
高品質モデル対応の AI ライティング。ブログ・コンテンツ事業者向けに、月額1,650円から記事生成を自動化。
- ✓最新 AI モデル対応で高品質出力
- ✓WordPress 直接投稿対応
- ✓5日間無料トライアル