今年大人気のAIペイントの遊び方
1. はじめに
2022 年は間違いなく AIGC 元年と言えます。Google の検索トレンドから判断すると、2022 年には AI 絵画および AI 生成アートの検索ボリュームが急増すると予想されます。
今年 AI ペイントが爆発的に普及した非常に重要な理由は、安定拡散のオープンソースです。これは、安定拡散モデルとも切り離せないものです。近年の拡散モデルの急速な発展と、OPENAI がすでに開発したテキスト言語モデル GPT-3 を組み合わせることで、テキストから画像への生成プロセスが容易になりました。
2. GAN (Generative Adversarial Network) のボトルネック
2014 年の誕生から 2018 年の StyleGAN まで、GAN は画像生成の分野で大きな進歩を遂げてきました。自然界の捕食者と被食者が競争して一緒に進化するのと同じように、GAN の原理は単純に 2 つのニューラル ネットワークを使用することです: 1 つはジェネレーターとして、もう 1 つは識別子として。ジェネレーターは、識別子が判断するための異なる画像を生成します。そうでないにせよ、2 つはモデルをトレーニングするために互いに競い合います。
GAN (Generative Adversarial Network) は継続的な開発を通じて良好な成果を上げてきましたが、常に克服が難しい問題がいくつかあります。それは多様性の欠如です。生成された結果には、モード崩壊 (最適なモードを見つけた後にジェネレーターが進行を停止する)、および高いトレーニング難易度が含まれます。これらの困難により、AI 生成アートが実用的な製品を生み出すことが困難になっています。
3. 拡散モデルのブレークスルー
長年の GAN ボトルネック期間を経て、科学者たちはモデルをトレーニングするための非常に魔法のような拡散モデル手法を考案しました。元の画像はマルコフ連鎖を使用して、継続的にこれにノイズ ポイントを追加し、最終的にランダム ノイズ画像になります。その後、トレーニング ニューラル ネットワークでこのプロセスを逆にして、ランダム ノイズ画像を徐々に元の画像に復元します。このようにして、ニューラル ネットワークはできると言われます。画像を最初から生成する機能。テキストから画像を生成するには、説明テキストを処理して元の画像にノイズとして追加することで、ニューラル ネットワークがテキストから画像を生成できるようになります。
安定拡散機能の紹介 (以下の写真は SD1 を使用して出力したものです) .5モデル) | ||||||
#はじめに | 入力 | 出力 | ||||
テキストの説明を通じて画像を生成し、テキストの説明を通じてアーティスト スタイルとアート タイプを指定できます。以下はアーティストのグレッグ・ルトコウスキーのスタイルの例です。 | 花柄のシャツを着た美しい少女が右手にあごを当てて写真を撮っている、グレッグ・ルトコウスキー作 | | img2img||||
生成写真とテキストの説明による写真 |
#花柄のシャツを着て、右手にあごを当てて写真を撮る美しい少女、グレッグ・ルトコウスキー作 |
|
|
|||
花柄のシャツを着た美しい少女が、右手にあごを乗せて優しく微笑んで写真を撮っている、グレッグ・ルトコウスキー作 |
|
|
||||
text2img 現在、最も効果的な 2 次元アニメーション スタイル モデルは、ダンブール Web サイトの公開画像をデータセットとして NAI によってトレーニングされていますが、ダンブール自体の著作権の問題により、NovelAI は常にこのモデルは商用サービスから漏洩したものであるため、注意して使用する必要があります。 |
花柄のシャツを着た美しい女の子が右手にあごを当てて写真を撮っています |
| img2img||||
img2img には NovelAI のモデルを使用します。現在、さまざまなコミュニティで非常に人気のある Yijian AI ペイントもこの機能を使用しています。しかし、Yiyi 氏は免責事項の中で、アニメーション モデルは収集したデータセットに基づいてトレーニングされたと述べました。 ##*右側の例のテキスト説明は、画像コンテンツと AI 推論に基づいています。アーティストのスタイルはランダムです | ##花柄のシャツを着た美しい女の子がポーズをとっている顎を右手に当てている写真については
|
|
ユーザーが提供した数枚の写真に基づいて被写体のモデルをトレーニングします。このモデルを使用して、説明に基づいて被写体を含む任意の写真を生成できます。 |
この写真セットは、同僚の 20 枚の写真を使用して、安定拡散 1.5 モデルに基づく 2000 ステップアウト モデルをトレーニングし、いくつかの様式化されたプロンプト出力を備えています。 プロンプト例 (図 1): アリスポイズンのポートレート、非常に詳細な VFX ポートレート、アンリアル エンジン、グレッグ ルトコウスキー、ロイシュ、ラドス、カスパール デビッド フリードリッヒ、新海誠、ロイス ヴァン バールレ、イリヤクブシノフ、ロスドローズ、エレジェント、トム バグショー、アルフォンス ミュシャ、グローバル イルミネーション、詳細かつ複雑な環境 *alicepoizon は、このモデルをトレーニングするときにこのキャラクターに付けられた名前です |
|
|
この一連の画像は、Dewu Digital Collection ME.X でのトレーニングを通じて微調整されたスタイル モデルを使用して生成されています。 | 花柄のシャツを着た美しい女の子 |
|
||||
## ##################レオナルド・ディカプリオ####################### ####### |
|
|||||
スカーレット・ヨハンソン |
|
|
##はじめに | ##サンプル|||
は、より便利な AI ペイント体験を提供し、さまざまなスタイルでカスタマイズされた多数の大型モデルを使用できます。 |
|
|||
2 つの商用 AI ペイント サービス。 Midjouney は高度な製品化を実現した独自のモデルを備えており、DallE 2 は有料の API サービスを提供し、より高品質な生成エフェクトを備えています。 |
Lensa、Manjing などはパーソナル モデル トレーニング サービスを提供します |
|||
|
https://www.php.cn/link/81d7118d88d5570189ace943bd14f142 現在主流の AI オープンソース コミュニティは、github に似ており、には、ユーザー独自の微調整された (微調整された) 安定した拡散ベースのモデルが多数あり、ダウンロードして自分のサーバーまたはローカル コンピューターに展開できます。 たとえば、右側の pix2pix モデルは、GPT3 と組み合わせた安定拡散モデルであり、自然言語記述を通じて上記の修復機能を完了できます。 |
|
7. 安定した拡散 WEBUI サービスを自分で構築する
7.1 クラウド バージョン
ここでは、AutoDL が提供するクラウド コンピューティング能力を使用して構築されていますが、他のプラットフォームを使用することもできます。 Google Colab や Baidu Feipiao など。
まず AutoDL にアカウントを登録し、A5000/RTX3090 グラフィックス カードを備えたクラウド ホストをレンタルします。 https://www.autodl.com/market/list- このホスト上にイメージを作成します。イメージについては、www.codewithgpu.com でパッケージ化されたアルゴリズム イメージを選択できます。ここでは例として画像 https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/Stable-Diffusion-for-NovelAI を選択して作成します。
次のコマンドを使用して開始します。システム ディスク領域が不足している場合は、stable-diffusion-webui/ フォルダーをデータ ディスクに移動し、autodl-tmp を再起動することもできます。起動エラーが発生した場合は、マシンの場所に応じて学術リソースのアクセラレーションを構成できます。
cd stable-diffusion-webui/ rm -rf outputs && ln -s /root/autodl-tmp outputs python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru
6.2 本地版本
優れたグラフィックス カードを搭載したコンピューターをお持ちの場合は、それをローカルに展開できます。ここでは、Windows バージョンの構築について説明します:
最初にPython 3.10.6 をインストールし、環境変数を Path に追加する必要があります。- git をインストールします。
- Stable Diffusion WEBUI プロジェクト コードをローカルにクローンします。
- モデル ファイルを models/ に配置します。 Stable-Diffusion ディレクトリ、関連モデルは https://www.php.cn/link/81d7118d88d5570189ace943bd14f142
- からダウンロードでき、webui-user.bat を実行し、ローカル コンピューターの IP とポート 7860 を介してサービスにアクセスします。 。
- 8. 概要
この記事では、AI ペイントに関するいくつかの関連情報を紹介します。興味のある友人は、自分でサービスを導入して、DreamBooth や最新の Lora の微調整の使い方を学ぶこともできます。大きなモデル。 AIGCの人気が高まる2023年には、私たちの仕事や生活はAIによって大きく変わると思います。少し前のChatGPTの登場は私たちに大きな衝撃を与えましたが、インターネットに参入した当初の情報検索能力と同じように、AIを使って仕事を支援することも今後は非常に重要な能力となるでしょう。
9.参考資料
原因から論争まで、AIジェネレーティブアート元年のAIを語ろう- https://sspai .com/post/76277
- https://blog.csdn.net / qq_45848817/article/details/127808815
- https://theaiSummer.com/diffusion-models/
- https://developers.google.com/machine-learning/gan/gan_struction
- https://www.entrogames.com/2022/08/absolute-beginners-guide-to-midjourney-magical-introduction-to-ai-art/
- # https://www.technologyreview.com/2022/12/12/1064751/the-viral -ai-avatar-app-lensa- undressed-me-without-my-consent/
instruct-pix2pix
- https://www.php.cn/link/81d7118d88d5570189ace943bd14f142timbrooks/instruct-pix2pix
以上が今年大人気のAIペイントの遊び方の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse()が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール(ShowProcessList、ShowStatus)を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

MySQLは開始を拒否しましたか?パニックにならないでください、チェックしてみましょう!多くの友人は、MySQLのインストール後にサービスを開始できないことを発見し、彼らはとても不安でした!心配しないでください、この記事はあなたがそれを落ち着いて対処し、その背後にある首謀者を見つけるためにあなたを連れて行きます!それを読んだ後、あなたはこの問題を解決するだけでなく、MySQLサービスの理解と問題のトラブルシューティングのためのあなたのアイデアを改善し、より強力なデータベース管理者になることができます! MySQLサービスは開始に失敗し、単純な構成エラーから複雑なシステムの問題に至るまで、多くの理由があります。最も一般的な側面から始めましょう。基本知識:サービススタートアッププロセスMYSQLサービススタートアップの簡単な説明。簡単に言えば、オペレーティングシステムはMySQL関連のファイルをロードし、MySQLデーモンを起動します。これには構成が含まれます
