拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説
コメント
注目のコメント
画像生成の仕組みや従来の技術との違いが、分かりやすく説明されています
・画像生成の仕組み
「画像の作り方」を覚えた拡散モデルに、「画像の概念」を理解しているVLM (Visual Language Model) を組み合わせて画像を生成
・従来の技術との違い
拡散モデルと類似の生成AIにGAN(敵対的生成ネットワーク)があり、こちらも画像生成AIなどで注目。
拡散モデルのような「画像の概念」を学ばせるような手法ではなく、どちらかと言えば「現実の画像と比較しながら間違った場所を修正していく」という、“美しい絵を書くための丁寧なアプローチ”。拡散モデルは画像生成のイメージが強いですが、例えば情報推薦に応用した論文が今年SIGIRで発表されるなど、「え、こんな使い方が」と思ってしまうような展開を見せています。しばらくブームが続きそうです。
わかりやすく画像生成AIが解説頂いてます。今後、画像生成AIのクリエイティブなどに触れる機会が増えると思いますが、学生さんなど、こういう考え方なんだという基礎知識の理解に役立つと思います。