AI アプリケーション Stable Diffusion の登場後、短期間で急速に人気を博し、多くのプレイヤーに受け継がれる「最も美しい女性」生成ツールとなりました。ただし、この AI コンピューティングおよび描画ツールが Stable Diffusion によって正式にリリースされたとき、WEB UI の展開とモデルのトレーニングと生成の両方が基本的に NVIDIA CUDA 加速アルゴリズムに基づいていたため、A カードは Stable Diffusion によって正式にサポートされていませんでした。最初は安定した拡散。幸いなことに、Stable Diffusion はオープン ソース製品です。多くのコミュニティ プレーヤーのサポートにより、A カード GPU アクセラレーション コンピューティングをサポートする多くのブランチが出現しました。たとえば、今日テストする DirectML ベースの展開では、AMD Radeon グラフィックスを実装できます。安定した拡散 AI コンピューティング ハードウェア アクセラレーション。
DirectML ベースの Stable Diffusion をローカルに展開する場合は、便利な CUDA ベースの WEB UI 展開よりも比較的複雑です。ただし、プレイヤーが適用できる比較的成熟した統合パッケージがオンラインですでに存在します。プレイヤーはダウンロードするだけで済みます。対応する統合パッケージは、ワンクリックでローカルでの確実なインストールと展開を実現できるため、全員の時間を大幅に節約できます。
▲テスト用に選択した統合パッケージがインストールされると、自動的に AMD GPU アクセラレーション コンピューティング モードに入ります。ローカルで http://127.0.0.1:7860 を開いて、ローカルの Stable Diffusion AI 描画インターフェイスを開きます。
▲ローカルの WEB UI インターフェイスで関連する AI アート描画生成パラメータを自由に設定し、[生成] をクリックして描画を開始できます。詳細については、関連するオンライン チュートリアルを参照してください。ここでは詳しく説明しません。
それでは、DirectML に基づく Stable Diffusion デプロイメント ブランチは、AMD グラフィックス カードのハードウェア コンピューティング アクセラレーションをサポートできますか?どれくらい効率的ですか?以前は、A カード プレーヤーは Linux システムで Stable Diffusion を実行し、ROCM (Radeon Open Compute) を通じて CUDA アクセラレーションをシミュレートすることしかできませんでしたが、現在では、A カードの AI アクセラレーション計算を Windows システムで直接実装できるようになりました。 ? 期待した目標を達成できるでしょうか?この目的のために、私たちはいくつかの AMD Radeon RX 5000 シリーズ、RX 6000 シリーズ、RX 7000 シリーズのグラフィックス カードを選択し、詳細な体験を実施しました。
エクスペリエンス プラットフォーム
グラフィックス カード: AMD Radeon RX 5500XT (8GB)、RX 5700 (8GB)、RX 6500XT 4GB、RX 6600 (8GB)、RX 6700XT (12GB)、RX 6750XT (12GB)、RX 6800 (16GB)、RX 6900XT ( 16GB)、RX 7900 XT (20GB)、RX 7900 XTX (24GB)
CPU: インテル Core i9-13900K
マザーボード: インテル Z790
メモリ: DDR5 6000 16GB×2
SSD: AORUS NVMe PCIe SSD 2TB
オペレーティング システム: Windows 11 Pro 22H2
ドライバー: AMD ソフトウェア Adrenalin エディション 23.4.3
テストすることで、次のことがわかります:
AMD Radeon 5000シリーズ、6000シリーズ、7000シリーズでは、Stable DiffusionのAI描画演算能力にどれくらいの差がありますか?
従来の CPU AI コンピューティング アクセラレーションと比較して、AMD GPU のアクセラレーション パフォーマンスはどうですか?
▲当社が採用したネットワークオープンソース共有展開ソリューションは、AMDグラフィックスカードのハードウェアアクセラレーション計算を正しく実装でき、画像生成プロセス中のGPU占有率が100%に維持されていることがわかります。
モデルは Novel AI Final-runed (CKPT)です
テストの最初の部分では、キーワードを使用して、目が大きく、ファッショナブルで美しく、写真のセンスもある女性を生成しました。キーワード設定は次のとおりです (一部はインターネット上のオープンソースの共有キーワードから引用):
lora:koreanDollLikeness_v15:0.6> 、最高品質、超高解像度、(フォトリアリスティック:1.4)、女性 1 人、ノースリーブの白いボタン シャツ、黒いスカート、黒いチョーカー、かわいい、(Kpop アイドル)、(愛嬌 sal:1) 、(プラチナブロンドの髪:1)、((腫れぼったい目))、見る人を見る、全身、正面を向いて、ファッション、プレミアム
解像度設定: 512×512
サンプリングステップ: 20
プロンプトワード誘導係数:7
バッチを生成 - バッチあたりの数量: 1-1、4-1
テストでは、ほとんどのグラフィックス カードには 8GB 以上のビデオ メモリが搭載されているため、基本的に動作パラメータで通常のハイビデオ デフォルト モードを設定しました。RX 6500XT の 4GB ビデオ メモリ バージョンのみ --lowvram の追加を使用しました。実行中、低メモリ実行モード (それ以外の場合は動作しません)。全体的なテスト結果から判断すると、Radeon RX 5000シリーズからRX 7000シリーズまでのAMDのグラフィックスカードは、ほぼすべてのStable DiffusionアプリケーションのAIコンピューティング加速性能を達成しており、特にRadeon RX 7000シリーズのグラフィックスカードの性能は優れています。 RX 6000 シリーズのグラフィックス カードよりも優れており、大幅な改善です。たとえば、この設定とモデル アルゴリズムの下での RX 6900XT の画像生成レートは約 8.87 ピクチャ/秒ですが、RX 7900 XT は 15.76 ピクチャ/秒に達し、ほぼ 100% のパフォーマンス向上になります。
CPU と比較すると、すべての AMD グラフィックス カードには明らかな利点があります。RX 7900 XT のパフォーマンスは、Core i9-13900K の約 30 倍です。最初の 2 世代のエントリーレベルのグラフィックス カード RX 5500XT でさえ、これもCore i9-13900Kの5倍近くです。
唯一の例外は RX 6500XT です。コア仕様によれば RX 5500XT よりも強力なはずですが、ビデオ メモリ構成が 4GB しかないため、テストで低ビデオ メモリ動作モードをオンにした後、生成された画像の速度は大きく影響を受け、GPU アクセラレーションの通常のパフォーマンスをはるかに下回り、CPU コンピューティングの速度よりもわずかに高いレベルにしか到達できません。
次のテストでは、一連の比較的複雑なキーワードを使用して、太陽光、波紋、反射などの効果の要件とともに、水辺にあるヴィラを生成しました。キーワードは次のとおりです:
'夕暮れ時の水の近くのチューダー様式の家の美しいレンダリング、ファンタジーの森。フォトリアリスティック、映画のような構成、映画のような高詳細、超現実的、映画のような照明、被写界深度、非常に詳細な、美しく色分けされた、8k、 '
解像度設定: 512×512
サンプリングステップ: 50
即語指導係数:7.5
バッチを生成 - バッチごとの数量: 1-1、2-1、4-1
この部分のテスト結果は、基本的に前のテストと一致しています。 RX 7000 シリーズ グラフィックス カードは依然としてパフォーマンスの面で優位を保っています。RX 6000 シリーズ グラフィックス カードと比較すると、パフォーマンスは約 100% 向上しています。CPU のコンピューティング パフォーマンスと比較すると、GPU アクセラレーション コンピューティングのパフォーマンス向上は依然として非常に顕著です。 RX 7900 XT のパフォーマンスは、Core i9-13900K のほぼ 5 倍に達します。
4GB ビデオ メモリ構成 RX 6500XT は低ビデオ メモリ モードでのみ実行できるため、画像生成速度は依然として大きな影響を受けますが、これは GPU アクセラレーションの通常のパフォーマンスよりもはるかに低く、Core i9-13900K とほぼ同等です。
これはシンプルですが興味深いテストです。この経験を通じて、プレイヤーが参照できるいくつかの参考ポイントを要約できると思います:
1. 現在、AMD グラフィックス カードは、オープン ソース展開ソリューションを通じて Windows システムで安定した拡散 AI コンピューティング アクセラレーションを実現でき、インターネット上には確実な統合パッケージも多数あります。興味のあるプレイヤーは試してみることができます;
2. テスト結果から判断すると、AMD グラフィックス カードは、Stable Diffusion の AI 画像生成計算において CPU 計算よりもはるかに優れたパフォーマンス向上を達成できます。GPU を使用して計算を高速化すると、半分の労力で 2 倍の結果が得られます。
3. テスト状況から判断すると、レンダリング解像度を 512 を超える設定 (768×768 など) に設定すると、ビデオ メモリを超えてしまいます。これは、導入計画やモデルと一定の関係がありますが、通常モードで実行する場合、8GB のビデオ メモリが安定した拡散のほぼ必須の要件となります。ビデオ メモリが 8GB 未満の場合、512×512 解像度でレンダリングする場合でも、ビデオ メモリが不足します。現時点では、--lowvram の低ビデオ メモリ実行ソリューションを使用する必要がありますが、速度が大幅に低下します。テスト RX 6500XT 4GB と同様に、計算速度を下げます。したがって、Stable Diffusion をスムーズにプレイしたい場合は、グラフィック カードのビデオ メモリが 8GB 以上であることをお勧めします。
4. 全体的な結果から判断すると、AMD GPU にはアルゴリズム最適化の余地がまだ大きいと考えられますが、信頼できない経験に基づくと、RX 7900 XTX と Core i9-13900K のパフォーマンスの差は十分に大きくありません。これは、私たちが導入したアルゴリズム ソリューションとモデルに関係するものであり、さまざまなコミュニティのプログラマーが AMD グラフィックス カード用のより優れたコンピューティング アクセラレーション ソリューションを開発できることを期待しています。何はともあれ、AMD グラフィックス カードの安定した拡散のためのハードウェア アクセラレーション コンピューティング パフォーマンスが実証されており、その効果は比較的明白です。これは間違いなく AMD グラフィックス カード ユーザーにとって朗報です。残りは、プレーヤーと AMD が以下のことを行う必要があるということです。最適化への道を歩み続ける時が来ました。
以上がAMD Radeonグラフィックスカード安定拡散AI描画体験テストの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。