Z.ai、新たなフラッグシップモデル「GLM-4.5」シリーズを発表

2025年7月29日 CoAI編集部

Z.aiは2025年7月28日、推論、コーディング、エージェンシック（自律的）タスクに特化した新しいフラッグシップモデル「GLM-4.5」と「GLM-4.5-Air」を発表しました。

2つのモデルラインナップを提供

GLM-4.5は総パラメータ数3,550億、アクティブパラメータ数320億で構成され、GLM-4.5-Airは総パラメータ数1,060億、アクティブパラメータ数120億となっています。両モデルは複雑化するエージェンシックアプリケーションの要求に応えるため、推論、コーディング、エージェンシック機能を単一モデルに統合することを目指して開発されました。

ハイブリッド推論モデルとして設計

両モデルはハイブリッド推論モデルとして設計されており、複雑な推論やツール使用のための「thinkingモード」と、即座の応答のための「non-thinkingモード」の2つのモードを提供します。ユーザーはZ.ai、Z.ai API、HuggingFace、ModelScopeを通じてこれらのモデルを利用できます。

主要AI企業との性能比較で上位にランクイン

Z.aiは、OpenAI、Anthropic、Google DeepMind、xAI、Alibaba、Moonshot、DeepSeekの各社モデルとの比較を、エージェンシック（3項目）、推論（7項目）、コーディング（2項目）の計12のベンチマークで実施しました。その結果、GLM-4.5が3位、GLM-4.5-Airが6位にランクインしました。

各分野での優れた性能を実現

エージェンシックタスクでは、GLM-4.5は128kのコンテキスト長とネイティブ関数呼び出し機能を提供し、τ-benchとBFCL-v3の両ベンチマークでClaude 4 Sonnetと同等の性能を示しました。Webブラウジングタスクを評価するBrowseCompベンチマークでは、GLM-4.5が26.4%の正答率を達成し、Claude-4-Opus（18.8%）を上回る結果となりました。

推論分野では、thinkingモードにより数学、科学、論理問題などの複雑な推論問題を解決できます。MATH 500では98.2%、AIME24では91.0%の精度を記録しました。

コーディング分野では、ゼロからのプロジェクト構築と既存プロジェクトでのコーディングタスクの両方に対応し、Claude Code、Roo Code、CodeGeexなどの既存コーディングツールキットとシームレスに連携できます。SWE-bench Verifiedでは64.2%のスコアを達成し、90.6%のツール呼び出し成功率を記録しました。

技術的特徴とアーキテクチャ

GLM-4.5シリーズはMoE（Mixture of Experts）アーキテクチャを採用し、訓練と推論の両方での計算効率を向上させています。また、Z.aiは大規模モデルの効率的な強化学習訓練を促進するため、「slime」というRLインフラストラクチャを開発・オープンソース化したことも発表しました。

オープンソース化とライセンス

GLM-4.5シリーズはMITライセンスの下でオープンソース化されており、商用利用や二次開発が可能です。これにより、中国発のオープンソースMoEモデルとして初めて、企業や開発者が自由に利用できる環境が整いました。

GLM-4.5の発表により、Z.aiは統合型AI能力の実現に向けて大きく前進し、急速に発展するエージェンシックAIアプリケーション市場での競争力を強化することになります。

CoAI編集部

AI分野の専門ライター