IT House は 11 月 30 日、Stability AI が以前の SDXL モデルの改良版である Stable Diffusion XL Turbo (SDXL Turbo) を最近発売したと報告しました。 SDXL Turboは「敵対的拡散蒸留技術」を用いて、画像生成の反復ステップを当初の50ステップから1ステップに削減したといい、「高画質な画像を生成するのに必要な反復ステップは1ステップだけ」という。 「
Stable Diffusion XL Turbo モデルの最大の特徴は、前述の「1 回の反復で画像を生成する」ことであると報告されており、これにより「瞬時のテキストから画像への出力」を実行でき、画像の品質。
書き直す必要があるのは次のとおりです。そのうちの 1 つは「敵対的拡散蒸留技術」と呼ばれるもので、既存の大規模画像拡散モデルを生成プロセスをガイドする「教師ネットワーク」として使用する技術です。このテクノロジーは、「蒸留テクノロジー」と「敵対的トレーニング」を組み合わせたもので、「蒸留テクノロジー」とは、モデルの出力を合理化するために、大きなモデルの知識をより小さなモデルに凝縮することを指します。敵対的トレーニングによりモデルが改善され、教師モデルの出力をより適切に模倣できるようになります。
従来モデルの蒸留技術では、高速サンプリングを行うと出力品質が低下するため、効率と品質のバランスをとることが困難でしたが、このStable Diffusion XL Turboモデルでは「敵対的拡散蒸留技術」を採用し、高品質な画像を効率的に生成します。進捗。Stable Diffusion XL Turbo を、StyleGAN-T、OpenMUSE、IF-XL、SDXL、LCM-XL を含む複数の異なるモデル バリアントと公式に比較し、2 つの実験を実施しました。最初の実験では、モデルが必要でした。評価者は、次の出力をランダムに表示します。 2 つのモデルを比較し、プロンプトの単語に最も一致する出力画像を選択します。2 番目の実験は、最初の実験とほぼ同じように実行されます。モデルの評価では、モデル内で最も画質の良い出力画像を選択する必要があります。
▲ 画像は Stability AI ブログより
実験結果は、Stable Diffusion XL Turbo が優れた画像生成品質を維持しながら、コンピューティング要件を大幅に削減できることを示しています。このモデルは、4 回の反復と比較して、わずか 1 回の反復で LCM-XL を上回ります。 4 回の反復を経た Stable Difffusion XL Turbo は、以前は設定に 50 回の反復を必要とした Stable Difffusion XL を簡単に上回ることができます。 A100 GPU
を使用して、解像度 512x512 の画像をわずか 207 ミリ秒で計算
IT House は、Stability AI が現在、個人および非営利目的で関連するコードを Hugging Face に公開していることに気付きました。興味のある友人は、ここをクリックしてアクセスしてください。以上がStability AI が Stable Diffusion XL Turbo モデルを発売の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。