PAI x EasyPhoto、エイプリル フールに別れを告げて、AI 写真でお祭りの雰囲気を作りましょう
イベントアドレス: https://developer.aliyun.com/topic/aigc_pai/newyear
チュートリアルの概要
生成 AI テクノロジーを応用して、本物の/似ている/美しい個人の写真をバッチで作成することが非常に人気です。最近リリースされた EasyPhoto は、オープンソースの SD WebUI プラグインとして、より柔軟で使いやすい開発手法を提供し、多くの開発者から注目と賞賛を集めています。同じ人物の複数の写真を作成し、ユーザー定義のテンプレート写真と組み合わせることで、最終的に真のリアルで美しいポートレート写真が生成されます。
EasyPhoto は、AI ポートレートを生成するための Webui UI プラグインです。 Lora ControlNet の StableDiffusion キャラクター カスタマイズ メソッドに基づいて、ローコード操作、カスタマイズされたスタイル、組み込みの豊富なテンプレートをサポートし、より多くの開発者が独自の様式化された芸術的な写真生成を柔軟に開発できるようにします。この AIGC 作成アクティビティは、Alibaba Cloud の人工知能プラットフォーム PAI に基づいており、EasyPhoto はローコードかつ高効率で起動され、お祭りの雰囲気のある美しい写真の迅速な生成を実現します。
このチュートリアルに基づいて、次のことを体験できます:
新規ユーザーは10,000元相当の人工知能プラットフォームPAIのトライアルリソースを無料で受け取ることができます
対話型モデリング PAI-DSW に基づいて個人用 LoRA モデルをトレーニングする
新しいホリデー AI 写真を作成して、クリスマス、新年、その他のホリデーのパーソナライズされた雰囲気を体験できるようにします
Redmi Watch3、Xiaomi Band 8などの作品を投稿して豪華プレゼントを獲得しましょう!
PAI を使用して EasyPhoto をすぐに開始する
1. 準備
1.1 インタラクティブ モデリング PAI-DSW
の無料試用権を取得します「hi 2024! AI New Year Photo Challenge」のイベントページにアクセスして、インタラクティブモデリング PAI-DSW 製品の無料トライアル リソース パッケージを受け取ります
- インタラクティブ モデリング PAI-DSW の新規ユーザー向けに、Alibaba Cloud は 5000CU*H の無料トライアル リソースを提供します。これはイベント ページで直接取得できます (トライアルのルールについては、Alibaba Cloud の無料トライアルを参照してください: https://free .aliyun.com/); または、インタラクティブ モデリング PAI-DSW リソース パッケージを購入してイベントに参加することもできます。購入リンク: PAI-DSW 100CU*H リソース パッケージ、価格は 59 元からです。リソースを購入しない場合は、パッケージ、PAI-DSW は、請求基準については、Alibaba Cloud 製品の価格を参照してください。
1.2 PAI-DSW インスタンスの作成
- 人工知能プラットフォーム PAI コンソールに移動し、リンク: https://pai.console.aliyun.com/
- 人工知能 PAI を開き、デフォルトのワークスペースを作成します。 「デフォルトのワークスペースのプロビジョニングと作成」を参照してください。
- 人工知能プラットフォーム PAI コンソールで、インタラクティブ モデリング PAI-DSW を選択します。
4. クリックしてインスタンスを作成します (上記参照)
5. 入力インスタンス名をカスタマイズします (「easyphoto」など)
インスタンス モデルを選択するときは、GPU カテゴリ ecs.gn6v-c8g1.2xlarge (リソース パッケージ控除をサポート) または ecs.gn7i-c8g1.2xlarge の使用を検討できます。
(サポート リソース パッケージの控除)。これら 2 つのモデルに在庫がある場合は、地域を変更して試すか、別の有料モデルを選択することができます (無料トライアルはサポートされていません)。
を選択します。
10. 3 ~ 5 分ほど待つと、インスタンスのステータスが「実行中」に変わり、インスタンスの作成が完了します。
1.3 PAI-DSW で EasyPhoto チュートリアルを開いて、ゼロコード AI 開発を体験してください
- EasyPhoto ベースの AI New Year-Christmas Photo Challenge (WebUI バージョン) のリンクを開き、右上隅の [Alibaba Cloud DSW で開く] をクリックします。
2. 前に作成したインスタンスを選択し、インスタンス名をクリックします。
3. ノートブック開発インターフェイスに入り、実行ボタンを段階的にクリックし、 1. セクション
4. 2 を実行します。WebUI セクションのセル
5. 生成されたリンクをクリックして WebUI に入ります
WebUI を開き、エクスペリエンス リンクを入力し、WebUI で EasyPhoto を実行します;
- 2. 体験を開始します
このチュートリアルを使用して、独自の休日の写真/アニメーションを生成できます。次の機能が提供されます:
写真の推論
- 写真に写っている人物の写真を指定してください(Photo2Photo)
- 指定テキストのキャラクター写真(Text2Photo)
- ビデオ推論
- 指定テキストの文字アニメーション(Text2Video)
- 画像のキャラクターアニメーションを指定(Image2Video)
- 動画のキャラクターアニメーションを指定する(Video2Video)
- 一般に、キャラクターのポートレート/アニメーションの生成は、次の 2 つのステップに分かれています。
ステップ 2: デジタル クローンに基づく画像/ビデオの生成
- 画像の生成についてはセクション 2.2 を参照し、ビデオの生成についてはセクション 2.3 を参照してください。
ステップ1: [EasyPhoto]タブをクリックします
ステップ 2: [写真のアップロード] をクリックして、独自のトレーニング写真 (5 ~ 20 枚の鮮明なポートレート、できれば半身/正面) をアップロードします。- 鮮明な個人のポートレート写真が 10 枚ない場合は、テストとしてモナリザの写真を選択できます。モナリザの写真のダウンロード リンクは次のとおりです: https://pai-aigc-photog.oss-cn-hangzhou.aliyuncs.com/webui/mona.zip
- ステップ 3: [トレーニングの開始] をクリックします (ポップアップ ボックスに任意のユーザー ID (英語) を入力します)
- リアル/アニメーション スタイルの 2 つのベース モデルが組み込まれており、好みに応じて独自のベース モデルを選択することもできます。
⚠️トレーニング プロセス中に図に示すようにフロントエンドの切断が発生した場合でも、ノートブックの背景でトレーニングの進行状況が確認できるため、心配しないでください。トレーニングが完了したら、フロントエンド ページを更新してモデル推論を実行します。
フロントエンドの切断 (接続タイムアウト。バックグラウンドがトレーニング中であることを確認してください):
-
- トレーニング完了リマインダー:
- SDWebUIフロントエンド
- ノートブックバックエンド
2.2 写真の推論
画像推論には写真推論を使用できます。サポートされているものは次のとおりです。
- 人物写真の指定画像(Photo2Photo)
- 指定テキストのキャラクター写真(Text2Photo)
2.2.1 キャラクター肖像画の指定画像
- ステップ 1: [写真推論] タブに切り替えます
- ステップ 2: 適切な画像アップロード方法を選択する
- テンプレート (テンプレート ギャラリー) から選択します。ギャラリーで画像を選択する必要があります
- 単一画像のアップロード
- バッチ画像アップロードテンプレート(バッチ画像アップロード)
- ステップ 3: UserId に対応するベース モデルと LoRA モデルを選択します (更新アイコンをクリックすると、すべての UserID のリストを取得できます)
- Infer With IPA を使用する場合、独自のデジタル クローンをトレーニングする必要はなく、ポップアップ画像ボックスに画像を直接アップロードして生成できます。
- ステップ 4: 関連パラメータは「詳細オプション」タブで設定できます
- バックグラウンド復元をオンにし、再描画範囲を調整し、テンプレート イメージを再描画して、さまざまな生成効果を実現できます。
- ステップ 5: [生成の開始] をクリックしてモデル推論を実行し、独自の AI ポートレートを生成します。 約 1 ~ 2 分待つとイメージの生成が完了し、イメージをダウンロードして保存できるようになります;
- ステップ 6: さらに画像の生成を選択し、[テキスト オプション] をクリックし、ワード アート効果を追加する適切なテンプレートを選択すると、生成された結果が [結果] の右側に表示されます。
- イベントページに写真を投稿して表彰イベントに参加してください;
- ステップ1: [設定]メニューを選択します
- ステップ 2: 左側のメニュー バーで ControlNet
- を見つけます ステップ 3: Multi-ControlNet の数を 4 以上に設定します
- ステップ4: クリックして設定を保存します
- ステップ 5: ノートブック ページに戻り、SDWebUI を停止して再起動します
2.2.2 指定されたテキストのキャラクターポートレート
- ステップ 1: Text2Photo タブに切り替えます
- ステップ 2: 適切なシーンを選択する
- ステップ 3: 関連するテキストの説明を変更する
- ステップ4: 生成された画像の解像度を設定します
- ステップ5: さらにコントロール画像を選択/アップロード(ジェスチャーコントロールOpenPose)
- ステップ6: Tushengtuと一致するベースモデル/User_idおよびその他のパラメータを設定し、画像を生成し、生成が完了したら自分でワードアート効果を追加します。
# ここの使用方法を参照して、独自のフェスティバル シーンをさらにトレーニングし、多様なポートレートを生成することができます~
2.3 ビデオ推論
ビデオ推論にはビデオ推論を使用できます。サポートされているものは次のとおりです。
- 指定テキストの文字アニメーション(Text2Video)
- 指定画像のキャラクターアニメーション(Image2Video)
- 動画のキャラクターアニメーションを指定する(Video2Video)
2.3.1 指定テキストの文字アニメーション
- ステップ 1: [ビデオ推論] タブに切り替えます
- ステップ 2: 適切なシーンを選択し、対応するプロンプトを変更します (指定されたテキストのキャラクター写真と同じ操作)
- ステップ 3: 画像サイズを設定するか、制御用のビデオをアップロードし、適切な制御方法を選択します。
- ステップ 4: 基本モデル、user_id、および関連パラメータを設定します。
⚠️ デフォルトでは、ビデオ生成の lcm アクセラレーションがオンになっています。このオプションをオフにすると、より多くの生成ステップを使用して、より詳細なビデオ結果を生成できます。
- ステップ 5: [生成開始] をクリックしてビデオを生成します
- フロントエンド エラーがある場合は、背景に生成が完了したことが表示されます。[最近の変換結果のリスト] をクリックして、生成された履歴ビデオをダウンロード/表示できます。 (更新する必要はありません)
- ステップ 6: [テキスト オプション] をクリックして、生成されたビデオにワード アート効果を追加します。フレームを選択することも、ビデオ全体にワードアート効果を適用することもできます。
2.3.2 指定画像のキャラクターアニメーション
- Step1: キャラクター写真をアップロード(生成したキャラクター写真はボタンから送信できます)/最初と最後の写真をアップロードします
- ステップ 2: 基本モデル、user_id、および関連パラメーターを設定します。 [生成の開始] をクリックしてビデオを生成します。また、テキスト オプションを使用してワード アートを追加します。
2.3.3 動画のキャラクターアニメーションを指定します
- ステップ1: キャラクタービデオをアップロードする
- ステップ 2: 基本モデル、user_id、および関連パラメーターを設定します。 [生成開始] をクリックしてビデオを生成します。また、テキスト オプションを使用してワード アートを追加します。
3. リソースのクリーンアップとフォローアップ
3.1 クリーンアップ
- 実験が完了したら、対応する製品コンソールに移動して、インスタンスを停止または削除できます (どちらの操作も可能です) インスタンスの実行を継続しないようにしてください。無料試用制限の後に追加の控除が発生する可能性があります。 ; を超えています。
- インスタンスは今後も使用されるとみなされます>>停止; インスタンスは今後使用されなくなります>>削除、リソースの消費はその後停止します停止に成功しました。
3.2 フォローアップ
トライアルの有効期間中は、モデルのトレーニングと推論検証に DSW インスタンスを引き続き使用できます。
添付ファイル:
EasyPhoto の共同ビルドへようこそ、Github アドレス: https://github.com/aigc-apps/sd-webui-EasyPhoto
元のリンク: https://developer.aliyun.com/article/1401917?utm_content=g_1000386818
この記事は Alibaba Cloud のオリジナルコンテンツであり、許可なく複製することはできません。
以上がPAI x EasyPhoto、エイプリル フールに別れを告げて、AI 写真でお祭りの雰囲気を作りましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

Dall-E 3:生成AI画像作成ツール 生成AIはコンテンツの作成に革命をもたらし、Openaiの最新の画像生成モデルであるDall-E 3が最前線にあります。 2023年10月にリリースされ、前任者のDall-EとDall-E 2に基づいています

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

Grok 3 - Elon MuskとXaiの最新のAIモデルは、最近の町の話です。 Andrej KarpathyからTech Influencersまで、誰もがこの新しいモデルの能力について話しています。最初は、アクセスが制限されていました

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク
