今年大人気のAIペイントの遊び方
1. はじめに
2022 年は間違いなく AIGC 元年と言えます。Google の検索トレンドから判断すると、2022 年には AI 絵画および AI 生成アートの検索ボリュームが急増すると予想されます。
今年 AI ペイントが爆発的に普及した非常に重要な理由は、安定拡散のオープンソースです。これは、安定拡散モデルとも切り離せないものです。近年の拡散モデルの急速な発展と、OPENAI がすでに開発したテキスト言語モデル GPT-3 を組み合わせることで、テキストから画像への生成プロセスが容易になりました。
2. GAN (Generative Adversarial Network) のボトルネック
2014 年の誕生から 2018 年の StyleGAN まで、GAN は画像生成の分野で大きな進歩を遂げてきました。自然界の捕食者と被食者が競争して一緒に進化するのと同じように、GAN の原理は単純に 2 つのニューラル ネットワークを使用することです: 1 つはジェネレーターとして、もう 1 つは識別子として。ジェネレーターは、識別子が判断するための異なる画像を生成します。そうでないにせよ、2 つはモデルをトレーニングするために互いに競い合います。
GAN (Generative Adversarial Network) は継続的な開発を通じて良好な成果を上げてきましたが、常に克服が難しい問題がいくつかあります。それは多様性の欠如です。生成された結果には、モード崩壊 (最適なモードを見つけた後にジェネレーターが進行を停止する)、および高いトレーニング難易度が含まれます。これらの困難により、AI 生成アートが実用的な製品を生み出すことが困難になっています。
3. 拡散モデルのブレークスルー
長年の GAN ボトルネック期間を経て、科学者たちはモデルをトレーニングするための非常に魔法のような拡散モデル手法を考案しました。元の画像はマルコフ連鎖を使用して、継続的にこれにノイズ ポイントを追加し、最終的にランダム ノイズ画像になります。その後、トレーニング ニューラル ネットワークでこのプロセスを逆にして、ランダム ノイズ画像を徐々に元の画像に復元します。このようにして、ニューラル ネットワークはできると言われます。画像を最初から生成する機能。テキストから画像を生成するには、説明テキストを処理して元の画像にノイズとして追加することで、ニューラル ネットワークがテキストから画像を生成できるようになります。
安定拡散機能の紹介 (以下の写真は SD1 を使用して出力したものです) .5モデル) | ||||||
#はじめに | 入力 | 出力 | ||||
テキストの説明を通じて画像を生成し、テキストの説明を通じてアーティスト スタイルとアート タイプを指定できます。以下はアーティストのグレッグ・ルトコウスキーのスタイルの例です。 | 花柄のシャツを着た美しい少女が右手にあごを当てて写真を撮っている、グレッグ・ルトコウスキー作 | | img2img||||
生成写真とテキストの説明による写真 |
#花柄のシャツを着て、右手にあごを当てて写真を撮る美しい少女、グレッグ・ルトコウスキー作 |
|
|
|||
花柄のシャツを着た美しい少女が、右手にあごを乗せて優しく微笑んで写真を撮っている、グレッグ・ルトコウスキー作 |
|
|
||||
text2img 現在、最も効果的な 2 次元アニメーション スタイル モデルは、ダンブール Web サイトの公開画像をデータセットとして NAI によってトレーニングされていますが、ダンブール自体の著作権の問題により、NovelAI は常にこのモデルは商用サービスから漏洩したものであるため、注意して使用する必要があります。 |
花柄のシャツを着た美しい女の子が右手にあごを当てて写真を撮っています |
| img2img||||
img2img には NovelAI のモデルを使用します。現在、さまざまなコミュニティで非常に人気のある Yijian AI ペイントもこの機能を使用しています。しかし、Yiyi 氏は免責事項の中で、アニメーション モデルは収集したデータセットに基づいてトレーニングされたと述べました。 ##*右側の例のテキスト説明は、画像コンテンツと AI 推論に基づいています。アーティストのスタイルはランダムです | ##花柄のシャツを着た美しい女の子がポーズをとっている顎を右手に当てている写真については
|
|
ユーザーが提供した数枚の写真に基づいて被写体のモデルをトレーニングします。このモデルを使用して、説明に基づいて被写体を含む任意の写真を生成できます。 |
この写真セットは、同僚の 20 枚の写真を使用して、安定拡散 1.5 モデルに基づく 2000 ステップアウト モデルをトレーニングし、いくつかの様式化されたプロンプト出力を備えています。 プロンプト例 (図 1): アリスポイズンのポートレート、非常に詳細な VFX ポートレート、アンリアル エンジン、グレッグ ルトコウスキー、ロイシュ、ラドス、カスパール デビッド フリードリッヒ、新海誠、ロイス ヴァン バールレ、イリヤクブシノフ、ロスドローズ、エレジェント、トム バグショー、アルフォンス ミュシャ、グローバル イルミネーション、詳細かつ複雑な環境 *alicepoizon は、このモデルをトレーニングするときにこのキャラクターに付けられた名前です |
|
|
この一連の画像は、Dewu Digital Collection ME.X でのトレーニングを通じて微調整されたスタイル モデルを使用して生成されています。 | 花柄のシャツを着た美しい女の子 |
|
||||
## ##################レオナルド・ディカプリオ####################### ####### |
|
|||||
スカーレット・ヨハンソン |
|
|
##はじめに | ##サンプル|||
は、より便利な AI ペイント体験を提供し、さまざまなスタイルでカスタマイズされた多数の大型モデルを使用できます。 |
|
|||
2 つの商用 AI ペイント サービス。 Midjouney は高度な製品化を実現した独自のモデルを備えており、DallE 2 は有料の API サービスを提供し、より高品質な生成エフェクトを備えています。 |
Lensa、Manjing などはパーソナル モデル トレーニング サービスを提供します |
|||
|
https://www.php.cn/link/81d7118d88d5570189ace943bd14f142 現在主流の AI オープンソース コミュニティは、github に似ており、には、ユーザー独自の微調整された (微調整された) 安定した拡散ベースのモデルが多数あり、ダウンロードして自分のサーバーまたはローカル コンピューターに展開できます。 たとえば、右側の pix2pix モデルは、GPT3 と組み合わせた安定拡散モデルであり、自然言語記述を通じて上記の修復機能を完了できます。 |
|
7. 安定した拡散 WEBUI サービスを自分で構築する
7.1 クラウド バージョン
ここでは、AutoDL が提供するクラウド コンピューティング能力を使用して構築されていますが、他のプラットフォームを使用することもできます。 Google Colab や Baidu Feipiao など。
まず AutoDL にアカウントを登録し、A5000/RTX3090 グラフィックス カードを備えたクラウド ホストをレンタルします。 https://www.autodl.com/market/list- このホスト上にイメージを作成します。イメージについては、www.codewithgpu.com でパッケージ化されたアルゴリズム イメージを選択できます。ここでは例として画像 https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/Stable-Diffusion-for-NovelAI を選択して作成します。
次のコマンドを使用して開始します。システム ディスク領域が不足している場合は、stable-diffusion-webui/ フォルダーをデータ ディスクに移動し、autodl-tmp を再起動することもできます。起動エラーが発生した場合は、マシンの場所に応じて学術リソースのアクセラレーションを構成できます。
cd stable-diffusion-webui/ rm -rf outputs && ln -s /root/autodl-tmp outputs python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru
6.2 本地版本
優れたグラフィックス カードを搭載したコンピューターをお持ちの場合は、それをローカルに展開できます。ここでは、Windows バージョンの構築について説明します:
最初にPython 3.10.6 をインストールし、環境変数を Path に追加する必要があります。- git をインストールします。
- Stable Diffusion WEBUI プロジェクト コードをローカルにクローンします。
- モデル ファイルを models/ に配置します。 Stable-Diffusion ディレクトリ、関連モデルは https://www.php.cn/link/81d7118d88d5570189ace943bd14f142
- からダウンロードでき、webui-user.bat を実行し、ローカル コンピューターの IP とポート 7860 を介してサービスにアクセスします。 。
- 8. 概要
この記事では、AI ペイントに関するいくつかの関連情報を紹介します。興味のある友人は、自分でサービスを導入して、DreamBooth や最新の Lora の微調整の使い方を学ぶこともできます。大きなモデル。 AIGCの人気が高まる2023年には、私たちの仕事や生活はAIによって大きく変わると思います。少し前のChatGPTの登場は私たちに大きな衝撃を与えましたが、インターネットに参入した当初の情報検索能力と同じように、AIを使って仕事を支援することも今後は非常に重要な能力となるでしょう。
9.参考資料
原因から論争まで、AIジェネレーティブアート元年のAIを語ろう- https://sspai .com/post/76277
- https://blog.csdn.net / qq_45848817/article/details/127808815
- https://theaiSummer.com/diffusion-models/
- https://developers.google.com/machine-learning/gan/gan_struction
- https://www.entrogames.com/2022/08/absolute-beginners-guide-to-midjourney-magical-introduction-to-ai-art/
- # https://www.technologyreview.com/2022/12/12/1064751/the-viral -ai-avatar-app-lensa- undressed-me-without-my-consent/
instruct-pix2pix
- https://www.php.cn/link/81d7118d88d5570189ace943bd14f142timbrooks/instruct-pix2pix
以上が今年大人気のAIペイントの遊び方の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock:現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

CのDMAとは、直接メモリアクセステクノロジーであるDirectMemoryAccessを指し、ハードウェアデバイスがCPU介入なしでメモリに直接データを送信できるようにします。 1)DMA操作は、ハードウェアデバイスとドライバーに大きく依存しており、実装方法はシステムごとに異なります。 2)メモリへの直接アクセスは、セキュリティリスクをもたらす可能性があり、コードの正確性とセキュリティを確保する必要があります。 3)DMAはパフォーマンスを改善できますが、不適切な使用はシステムのパフォーマンスの低下につながる可能性があります。実践と学習を通じて、DMAを使用するスキルを習得し、高速データ送信やリアルタイム信号処理などのシナリオでその効果を最大化できます。

Cは、リアルタイムオペレーティングシステム(RTOS)プログラミングでうまく機能し、効率的な実行効率と正確な時間管理を提供します。 1)Cハードウェアリソースの直接的な動作と効率的なメモリ管理を通じて、RTOのニーズを満たします。 2)オブジェクト指向の機能を使用して、Cは柔軟なタスクスケジューリングシステムを設計できます。 3)Cは効率的な割り込み処理をサポートしますが、リアルタイムを確保するには、動的メモリの割り当てと例外処理を避ける必要があります。 4)テンプレートプログラミングとインライン関数は、パフォーマンスの最適化に役立ちます。 5)実際のアプリケーションでは、Cを使用して効率的なロギングシステムを実装できます。

MySQLでは、AlterTabletable_nameaddcolumnnew_columnvarchar(255)afterexisting_columnを使用してフィールドを追加し、andtabletable_namedopcolumncolumn_to_dropを使用してフィールドを削除します。フィールドを追加するときは、クエリのパフォーマンスとデータ構造を最適化する場所を指定する必要があります。フィールドを削除する前に、操作が不可逆的であることを確認する必要があります。オンラインDDL、バックアップデータ、テスト環境、および低負荷期間を使用したテーブル構造の変更は、パフォーマンスの最適化とベストプラクティスです。

Cのスレッドパフォーマンスの測定は、標準ライブラリのタイミングツール、パフォーマンス分析ツール、およびカスタムタイマーを使用できます。 1.ライブラリを使用して、実行時間を測定します。 2。パフォーマンス分析にはGPROFを使用します。手順には、コンピレーション中に-pgオプションを追加し、プログラムを実行してGmon.outファイルを生成し、パフォーマンスレポートの生成が含まれます。 3. ValgrindのCallGrindモジュールを使用して、より詳細な分析を実行します。手順には、プログラムを実行してCallGrind.outファイルを生成し、Kcachegrindを使用して結果を表示することが含まれます。 4.カスタムタイマーは、特定のコードセグメントの実行時間を柔軟に測定できます。これらの方法は、スレッドのパフォーマンスを完全に理解し、コードを最適化するのに役立ちます。

上位10のデジタル仮想通貨取引プラットフォームは次のとおりです。1。Binance、2。Okx、3。Coinbase、4。Kraken、5。HuobiGlobal、6。Bitfinex、7。Kucoin、8。Gemini、9。Bitstamp、10。Bittrex。これらのプラットフォームはすべて、さまざまなユーザーニーズに適した高度なセキュリティとさまざまな取引オプションを提供します。

交換に組み込まれた量子化ツールには、1。Binance:Binance先物の定量的モジュール、低い取り扱い手数料を提供し、AIアシストトランザクションをサポートします。 2。OKX(OUYI):マルチアカウント管理とインテリジェントな注文ルーティングをサポートし、制度レベルのリスク制御を提供します。独立した定量的戦略プラットフォームには、3。3Commas:ドラッグアンドドロップ戦略ジェネレーター、マルチプラットフォームヘッジアービトラージに適しています。 4。Quadency:カスタマイズされたリスクしきい値をサポートするプロフェッショナルレベルのアルゴリズム戦略ライブラリ。 5。Pionex:組み込み16のプリセット戦略、低い取引手数料。垂直ドメインツールには、6。cryptohopper:クラウドベースの定量的プラットフォーム、150の技術指標をサポートします。 7。BITSGAP:

マウススクロールイベントの浸透の効果を実現する方法は? Webを閲覧すると、いくつかの特別なインタラクションデザインに遭遇することがよくあります。たとえば、DeepSeekの公式ウェブサイトでは、...
