このPythonスクリプトは、ハグするFace Diffusersライブラリを使用して、安定した拡散v1.5を使用して入力画像のバリエーションを生成します。 画像操作の強力なツールであり、ユーザーがテキストプロンプトに基づいて画像を変換できるようにします。
スクリプトは、関数を定義することから始まります。この関数は、ローカルイメージパスとURLの両方を処理し、さまざまな入力ソースとの互換性を確保します。画像をRGBに変換し、アスペクト比を維持しながら画像を変更し、安定した拡散モデルで処理するために一貫した768x768サイズにパッドをパッドします。
load_image
コア機能は
(変換のレベルを制御する)やgenerate_image_variation
(出力がプロンプトにどの程度密接に準拠するかに影響を与える)などの重要なパラメーターにより、画像生成プロセスを細かく制御できます。 この機能により、再現性のためにランダムシードを設定することもできます。
strength
最後に、guidance_scale
生成された画像をシーケンシャル番号を付けてディレクトリに保存します。
を呼び出して3つのバリエーションを作成し、save_generated_images
。images-out
を使用して保存します。
強度:generate_image_variation
save_generated_images
ローカルの実行:スクリプトはローカルで実行され、クラウドベースのサービスと関連するコストの必要性を排除します。
strength
guidance_scale
多用途の入力:seed
モデルの制限:安定した拡散v1.5の使用は、その特定のモデルの機能によってスクリプトが制限されることを意味します。 新しいモデルは、パフォーマンスや機能の改善を提供する場合があります
提供された例は、特定の芸術スタイルのプロンプトを使用して画像を変換します。 前後の画像は、テキストの説明に基づいて、画像のスタイルと外観を変更するスクリプトの能力を示しています。 結果は、安定した拡散モデルの有効性と、画像操作のためにスクリプトを統合する能力を視覚的に示しています。
以上が安定した拡散Vを使用して、ラップトップでAI搭載の画像処理のロックを解除します。思ったよりも簡単です。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。