iconLogo
Published:2025/12/3 12:46:42

タイトル & 超要約:拡散モデルのバイアス除去!爆誕、完全自動化🎉

キラキラポイント✨ ● 教師データなしでバイアス除去!神ってる~😇 ● 抽象的な概念(例: 平和)にも対応!凄すぎ✨ ● 既存のモデルにすぐ使える!汎用性バッチリ👍

詳細解説 ● 背景 テキストから画像生成するモデル(拡散モデル)は、学習データに偏りがあると、画像も偏っちゃう問題があったの😱 例えば、特定の人種や性別の人を不当に優遇しちゃうとか… 既存の方法は、データセット作り直しとか、属性ラベル(誰が誰かみたいな情報)が必要だったけど、手間がかかるって問題があったんだよね😢

● 方法 この研究は、拡散モデルの内部(h-space)を直接いじることで、バイアスを除去するよ!

  1. Semantic Projection Module: 画像の特徴を分析するよ!
  2. Semantic Mode Discovery Module: 特徴をグループ分け!
  3. Self-Debias Module: グループのバランスを整える! 難しいこと言ってるけど、要はモデルを改造しなくても、偏りをなくせるってこと!

● 結果 この方法を使うと、人種や性別のバイアスだけでなく、抽象的な概念(例: 幸せそうな風景)に関するバイアスも除去できることが分かったの!👏 しかも、既存のモデルにポン付けできるから、使いやすいのも最高🥰

続きは「らくらく論文」アプリで

Fully Unsupervised Self-debiasing of Text-to-Image Diffusion Models

Korada Sri Vardhana / Shrikrishna Lolla / Soma Biswas

Text-to-image (T2I) diffusion models have achieved widespread success due to their ability to generate high-resolution, photorealistic images. These models are trained on large-scale datasets, like LAION-5B, often scraped from the internet. However, since this data contains numerous biases, the models inherently learn and reproduce them, resulting in stereotypical outputs. We introduce SelfDebias, a fully unsupervised test-time debiasing method applicable to any diffusion model that uses a UNet as its noise predictor. SelfDebias identifies semantic clusters in an image encoder's embedding space and uses these clusters to guide the diffusion process during inference, minimizing the KL divergence between the output distribution and the uniform distribution. Unlike supervised approaches, SelfDebias does not require human-annotated datasets or external classifiers trained for each generated concept. Instead, it is designed to automatically identify semantic modes. Extensive experiments show that SelfDebias generalizes across prompts and diffusion model architectures, including both conditional and unconditional models. It not only effectively debiases images along key demographic dimensions while maintaining the visual fidelity of the generated images, but also more abstract concepts for which identifying biases is also challenging.

cs / cs.CV