ニュース一覧に戻る
アリババ、画像編集AI「Qwen-Image-Edit」を正式リリース – テキストもビジュアルも“思いどおり”に編集可能

アリババ、画像編集AI「Qwen-Image-Edit」を正式リリース – テキストもビジュアルも“思いどおり”に編集可能

2025年8月22日 CoAI編集部 リリース

生成AIの勢いが止まりません。8月19日、アリババは画像生成モデル「Qwen-Image」を大幅に強化した 画像編集特化モデル「Qwen-Image-Edit」 を正式公開しました。

テキスト修正からオブジェクトの追加・削除、さらには IP キャラクターの別角度生成まで、想像したとおりに画像を加工できる――そんな“万能さ”がクリエイター界隈で早くも話題です。

Qwen-Image-Edit とは?

Qwen-Image-Edit は、20B パラメータの Qwen-Image をベースに開発された次世代画像編集 AI です。最大の特長は 意味的編集(Semantic)と外観的編集(Appearance)を一つのモデルで両立 した点にあります。

コア機能

  • 精密テキスト編集
    フォントやレイアウトを崩さず、中国語・英語の文字を追加・削除・書き換えできます。
  • 意味的編集
    キャラクターを 90°/180°回転させても一貫性を保ったまま別アングルを生成。ジブリ風などのスタイル変換も可能です。
  • 外観的編集
    非編集領域を“完全に不変”のまま、看板の合成や髪の毛の除去、文字色の変更といったピンポイント修正を実現します。

仕組みがユニーク

入力画像は

  1. 視覚的意味を制御する Qwen2.5-VL
  2. 画質を担保する VAE Encoder

へ同時に流れ、意味的一貫性とディテール保持を両立する二経路アーキテクチャを採用しています。公開ベンチマークでは画像編集タスクで SOTA を記録したと報告されています。

どうやって試す?

  1. Qwen Chat
    「Image Editing」モードを選ぶだけでブラウザから即体験できます。
  2. オープンソース配布
    モデルは GitHub や Hugging Face で公開されており、研究用途にも自由に導入可能です。
  3. クラウド推論
    fal.ai なら 1 MP あたり 0.03 ドルで手軽に推論が可能。
  4. ComfyUI ネイティブ対応
    8月19日から正式サポートが始まり、Lightning LoRA を併用すれば VRAM16 GB 環境で 4 ステップ約36秒、8 ステップ約59秒で編集できると日本語チュートリアルが報告しています。

クリエイターの作業が一変

チラシの誤字修正、EC 商品画像の色合わせ、IP キャラの別ポーズ量産など、これまで Photoshop で何工程もかかった作業がほぼ“プロンプト一行”で完了します。段階的に微修正を重ねる「チェーン編集」も得意なため、細部品質を突き詰めたいプロにも重宝しそうです。

まとめ:画像編集の“標準”が塗り替わるかも

Qwen-Image-Edit は「生成」から「編集」へと AI 活用の幅を一気に広げました。文字もビジュアルも思いどおりに操れるこのモデルは、デザイナーやマーケターはもちろん、趣味で画像加工を楽しむ人にとっても強力な相棒になるはずです。今後のアップデートとコミュニティの応用事例に注目していきましょう。

CoAI編集部

AI分野の専門ライター