Google、最高峰のAIモデル「Gemini 3」を発表 – 推論能力とマルチモーダル性能で新記録を達成
GoogleがAI技術の新たな時代を切り開く「Gemini 3」を発表しました。同社CEOのSundar Pichai氏によると、Gemini 3はこれまでで最も高度なモデルであり、複雑なアイデアを現実化するための画期的な機能を備えています。
世界トップクラスの推論能力
Gemini 3 Proは、すべての主要AIベンチマークでGemini 2.5 Proを大幅に上回る性能を達成しました。LMArenaリーダーボードで1501 Eloという画期的なスコアを記録し、首位を獲得しています。特に「Humanity’s Last Exam」では37.5%、GPQA Diamondでは91.9%のスコアを獲得し、博士レベルの推論能力を実証しました。数学分野においても、MathArena Apexで23.4%という新たな最高記録を樹立しています。
マルチモーダル性能の飛躍的向上
テキストだけでなく、画像や動画を含むマルチモーダル推論においても、Gemini 3は新たな基準を確立しました。MMMU-Proで81%、Video-MMMUで87.6%のスコアを記録し、マルチモーダル理解能力の最高峰に到達しています。また、SimpleQA Verifiedで72.1%を達成し、事実の正確性においても大きな進歩を遂げました。
Gemini 3 Deep Thinkモード
さらに高度な推論が必要な場合には、Gemini 3 Deep Thinkモードが利用できます。このモードでは、Humanity’s Last Examで41.0%、GPQA Diamondで93.8%を達成し、通常のGemini 3 Proをさらに上回る性能を発揮します。ARC-AGI-2では前例のない45.1%を記録し、新しい課題を解決する能力を示しました。
学習、開発、計画の支援
Gemini 3は100万トークンのコンテキストウィンドウを備え、さまざまな学習ニーズに対応します。例えば、異なる言語で書かれた手書きのレシピを解読して翻訳し、家族の料理本を作成することができます。また、学術論文や長時間の動画講義を分析し、インタラクティブなフラッシュカードや視覚化コードを生成することも可能です。
開発者向けには、WebDev Arenaリーダーボードで1487 Eloを記録し、リッチでインタラクティブなWeb UIの生成に優れた性能を発揮します。SWE-bench Verifiedでは76.2%を達成し、コーディングエージェントとしての能力を証明しました。
Google Antigravityの登場
Googleは、Gemini 3の高度な推論能力を活用した新しいエージェント開発プラットフォーム「Google Antigravity」も発表しました。このプラットフォームでは、AIアシスタントがツールから開発パートナーへと進化し、エディタ、ターミナル、ブラウザに直接アクセスして、複雑なソフトウェアタスクを自律的に計画・実行できます。
提供開始と今後の展開
Gemini 3は本日より、Geminiアプリ、Google AI Studio、Vertex AI、Google Antigravityを通じて提供が開始されます。また、AI Mode in Searchでも初日から利用可能となり、検索機能に直接統合されるのはこれが初めてとなります。Gemini 3 Deep Thinkモードについては、安全性評価を経た後、数週間以内にGoogle AI Ultraサブスクライバー向けに提供される予定です。
Googleは、Gemini 3が最も包括的な安全性評価を受けたモデルであることを強調しており、プロンプトインジェクションへの耐性向上やサイバー攻撃からの保護機能が強化されています。