タイトル & 超要約:画像編集AI「QwenStyle」、コンテンツそのままにイケてる加工!✨
ギャル的キラキラポイント✨ ● 元の写真のクオリティを保ったまま、色んなスタイルに変身できちゃうとこ! ● eコマースとか広告で、超使える!ビジネスチャンスしかないじゃん? ● 3段階学習(Curriculum Continual Learning)で、さらに性能アップしてるって、マジすごい!
詳細解説 背景: 拡散モデル(Diffusion Transformers, DiTs)ってのがあって、これまでは写真の加工で「なんか違う…」ってなることあったの😩。でも!Qwen-Image-Editっていう、すごい画像編集モデルをベースにして、コンテンツをしっかりキープしたままスタイルだけ変えられるようにしたのがQwenStyleなの!
方法: QwenStyleは、3段階の学習フレームワーク(Curriculum Continual Learning)を使ってて、コンテンツをちゃんと残せるように工夫してるんだって!高品質なデータで学習してるから、マジでクオリティ高い仕上がりになるみたい💖。APIで公開もするから、色んなサービスに使えるのもアツい🔥!
続きは「らくらく論文」アプリで
Content-Preserving Style transfer, given content and style references, remains challenging for Diffusion Transformers (DiTs) due to its internal entangled content and style features. In this technical report, we propose the first content-preserving style transfer model trained on Qwen-Image-Edit, which activates Qwen-Image-Edit's strong content preservation and style customization capability. We collected and filtered high quality data of limited specific styles and synthesized triplets with thousands categories of style images in-the-wild. We introduce the Curriculum Continual Learning framework to train QwenStyle with such mixture of clean and noisy triplets, which enables QwenStyle to generalize to unseen styles without degradation of the precise content preservation capability. Our QwenStyle V1 achieves state-of-the-art performance in three core metrics: style similarity, content consistency, and aesthetic quality.