
Google、生成AI「Gemini」の環境負荷を1年で大幅削減 – 1回のテキストプロンプトあたり電力33分の1・CO₂44分の1
Googleは2025年5月、生成AIサービス「Gemini」で1回のテキストプロンプトを処理する際の環境負荷を大幅に削減したと発表しました。Google公式ブログ「Our approach to energy innovation and AI’s environmental footprint」および論文「Measuring the environmental impact of delivering AI at Google Scale」によると、2024年5月からの1年間で次のような改善が達成されています。
主な削減実績
- 電力消費 0.24 Wh/回(33×効率化)
- CO₂排出 0.03 g/回(44×削減)
- 水使用量 0.26 mL/回(約5滴)
0.24 Whは家庭用テレビを約9 秒視聴するのと同程度、0.26 mLはコーヒー1滴の約5分の1というわずかな量です。
効率化を支えた7つの要因
- Mixture-of-Expertsなど効率的なモデル構造で必要パラメータのみ稼働
- 量子化・スペキュレーティブデコーディングといった推論アルゴリズム最適化
- 新世代 TPU「Ironwood」 による30×高い電力効率
- リクエストをまとめる バッチ推論 と動的負荷分散でGPU/TPU稼働率を最大化
- データセンター平均 PUE 1.09 の実現(冷却などの無駄を最小化)
- 高負荷時も無駄を減らす アイドル最適化 とモデル蒸留(Gemini Flashなど)
- 世界各地で進む 24/7 クリーンエネルギー調達 により電力当たりCO₂を30%低減
なぜ従来推計と大きく違うのか
多くの外部試算は「GPUのみ」「高負荷ベンチ」など狭い測定範囲を前提にしており、実運用でのバッチ効率やデータセンター全体最適を加味できていません。Googleは
- アクセラレータ+CPU/DRAM
- 待機マシン
- 冷却・電源などオーバーヘッド
まで含む“包括的境界”を設定しながら、実サービスの利用実績で割り戻す手法を採用。これが桁違いの低数値につながったと説明しています。
今後の展望
Googleは測定方法の標準化と透明性向上を業界に呼びかけており、他社でも同様のフルスタック測定が普及すれば、AI利用拡大と環境負荷低減を両立できるとしています。