ニュース一覧に戻る
Stability AI、エンタープライズ向け音声生成AI「Stable Audio 2.5」をリリース

Stability AI、エンタープライズ向け音声生成AI「Stable Audio 2.5」をリリース

2025年9月15日 CoAI編集部

3分間の楽曲を2秒未満で生成、ブランド独自の音響アイデンティティ構築を支援

2025年9月10日 – 画像生成AI「Stable Diffusion」で知られるStability AIは、エンタープライズ用途に特化した音声生成AI「Stable Audio 2.5」を発表しました。同社は「大規模なエンタープライズ向けサウンド制作のために構築された初の音声生成モデル」と位置付けています。

高速生成と高品質を両立

Stable Audio 2.5の最大の特徴は、その圧倒的な生成速度です。最新のAdversarial Relativistic-Contrastive(ARC)手法を採用し、H100 GPUでは最大3分間の楽曲をわずか2秒未満で生成できます。Stability AIは「我々が知る限り最も高速なテキスト音声生成モデル」と説明しています。

企業ブランド向けの新機能

新モデルでは、イントロ、展開部、アウトロなど複数のパートから構成される動的な音楽構造の生成が可能になりました。また、「アップリフティング」などのムード記述子や「豊かなシンセサイザー」といったジャンル横断的な音楽表現にも、より効果的に応答できるようになっています。

特に注目すべきは、新たに追加された「音声インペインティング」機能です。ユーザーは独自の音声ファイルをアップロードし、開始点を選択することで、AIが文脈に基づいて残りの部分を生成することができます。

商用利用を重視した設計

Stable Audio 2.5は、ライセンス取得済みのデータセットで学習されており、商用利用に適した設計となっています。利用規約では著作権保護されたコンテンツのアップロードを禁止し、高度なコンテンツ認識技術を使用してコンプライアンスを維持しています。

Stability AIの調査によると、音声はブランドエンゲージメントの86%に影響を与えるものの、サウンドアイデンティティを活用する企業はわずか6%にとどまっているとのことです。同社は「カスタマイズされたサウンドは、ブランドを8倍記憶に残りやすくする」と説明しています。

WPPとの戦略的提携

Stability AIは、世界最大級の広告代理店グループWPPと戦略的パートナーシップを締結しており、Stable Audio 2.5はWPP Openプラットフォームを通じて世界中の顧客に提供される予定です。

利用方法と料金体系

Stable Audio 2.5は現在、StableAudio.comで試用できるほか、Stability AI API、fal、Replicate、ComfyUIなどのパートナープラットフォームを通じて利用可能です。エンタープライズライセンスによるオンプレミス展開にも対応しています。

広告、ゲームイントロ、店舗内BGM、クレジットカードの決済音、自動車のオーディオシステムまで、様々な用途でブランド一貫性のある音響体験を提供することが期待されています。

Stability AI Introduces Stable Audio 2.5, the First Audio Model Built for Enterprise Sound Production at Scale

CoAI編集部

AI分野の専門ライター