2年前、コロラド・ステート・フェアのアート・コンペティションで、「スペース・オペラ」という作品が1位を獲得しました。
この絵は雄大で、光と闇があり、フランスの象徴主義画家ギュスターヴ・モローを非常に思い出させます。ただし人間が描いたものではなく、絵の基礎のない出場者がAI描画ツールを使って描いたもの。
時間を2018年に戻しましょう。当時、ニューヨークのクリスティーズのオークションハウスでは、「エドモンド・ベラミーの肖像」と呼ばれるAI絵画が40万ドル以上で落札された。これは、オークションに出品される初めての人工知能作品であり、AI アート作品が市場で認知される始まりでもあります。
AIペイントが当たり前になった現在、国内外のAIプレイヤーが次々と退場し、この軌跡も煙に巻かれています。
例えば、有名な海外の AI 写真生成アプリケーション、Midjourney、Stable Diffusion、DALL-E は、Byte、Alibaba、Tencent などの国内企業と絶えず戦い続けています。それから。
しかし、AI 愛好家にとって、より強力な画像とテキストのマッチングを実現するにはどうすればよいでしょうか。より美しい画像を生成するにはどうすればよいでしょうか? Vincent ダイアグラム モデルを効率的に展開するにはどうすればよいですか?
「AIGC体験スクール」の第6話ではこの件についてお話します。
「AIGC Experience Party」ビデオ プログラムは、Volcano Engine、NVIDIA、この Web サイト、CMO CLUB が共同で立ち上げたもので、マーケティング分野の多くの専門家が集まり、AIGC テクノロジーの応用、考え方、実践について話し合います。
このエピソードでは、業界の上級ゲスト 2 名が、美的テキスト画像の背後にある技術的つながりを深く分析し、より強力な画像とテキストのマッチングを実現する方法を全員に教えます。
ライブ放送時間: 8月6日 19:00-19:40
ライブ放送テーマ: ファンタジーイメージング、美しいヴィンセントの写真の背後にある技術的リンク
6本目プログラムのエピソードでは、Doubao Wenshengtu テクノロジ エキスパートの Zhang Liang 氏と NVIDIA ソリューション アーキテクトの Zhao Yijia 氏という 2 人の重要なゲストが招待されました。
ユーザーはいくつかの簡単なプロンプト単語を入力するだけで、AI がリアルで繊細な絵画を自動的に生成します。古典的な油絵の繊細な質感も、現代の抽象芸術の自由な表現も、東洋の水墨画の奥深い芸術的概念も、簡単に創作できます。歴史上の有名な画家のスタイルを学んで模倣するだけでなく、新しいアートジャンルを作成し、ユーザーに前例のない創造的でインタラクティブな体験をもたらします。
今日、AI絵画は「洗練」され、真と偽の区別が難しいほどに進化しています。
たとえば、これ:
またはこれ:
AI Wenshengtu が大手 AI メーカーが競争する「香り」となったのは、まさにそのユニークな創造性と没入型のインタラクティブな体験のおかげです。 」。
たとえば、Byte は Jiuying、Xinghua、Jimeng などの AI 製品を一斉にリリースしましたが、それらは例外なくすべて Wenshengtu の機能を備えており、これらの製品の背後には Byte の Doubao Wenshengtu Large モデルが切り離せません。
Vincentian グラフ モデルの場合、ユーザーの「人気」を獲得するには、より強力な画像とテキストのマッチング、より美しい画像効果、より高速な生成エクスペリエンスという 3 つのこと以外に何もありません。
それでは、Doubao Wensheng 大型モデルはどのようにして、ユーザーのアイデア デザインを満たすためのより強力な画像とテキストのマッチングを実現するのでしょうか?より究極のユーザーエクスペリエンスを提供するために、より美しい画像を生成するにはどうすればよいでしょうか?非常に大規模なサービス コールに対応するためにグラフをより迅速に作成するにはどうすればよいでしょうか?
これらの質問の答えは、第6回の「AIGC体験会」で明らかになります。
8月6日午後7時、ライブブロードキャストルームに来て、「ファンタジーイメージング、超美麗なヴィンセントの写真の背後にある技術的リンク」を視聴し、QRコードをスキャンしてライブブロードキャストに直接アクセスしてください部屋。
前号の振り返り
「AIGC Experience Party」の 5 回目のライブ ブロードキャストでは、Volcano Engine のコンテンツ セキュリティおよびリスク管理責任者の Zhang Jianyang 氏と、NVIDIA エンタープライズ開発者コミュニティのシニア マネージャーの He Kun 氏が登壇しました。では、マーケティング分野のイノベーションとセキュリティの問題におけるAIGCの詳細な分析を行い、変化の中で持続的な成長とビジネスの着実な発展を達成する方法を共有しました。
ご存知のとおり、AIGC テクノロジーは徐々に企業マーケティングの革新的なツールになりつつあります。マーケティング担当者が想像力に富んだマーケティング資料を、いくつかのキーワードやプロンプトワードを入力するだけで、短時間で自動的に生成できるように支援します。
しかし、他の技術革新と同様に、AIGC はマーケティングの創造性と効率を向上させる一方で、多くのセキュリティ上の問題ももたらします。
Volcano Engine のコンテンツ セキュリティおよびリスク管理責任者である Zhang Jianyang 氏は、実際の事例を使用して Volcano Engine の AI テクノロジーがどのようにマーケティング担当者を「保護」できるかを実証しました。
Zhang Jianyang 氏は、大規模なモデルの錯覚によって出力結果を完全に制御できなくなり、マーケティング コンテンツにおけるさまざまな潜在的なコンテンツ リスクにつながると述べました。たとえば、AIGC テクノロジーによって作成されたマーケティング コピーには、「最高」、「最初」、「世界クラス」、「ネットワーク全体で最初」などの「絶対的な」用語が含まれており、生成されたマーケティング画像やビデオには、下品な言葉や質の低い言葉が広告に含まれると、ブランドイメージを損なうだけでなく、世間の嫌悪感を引き起こします。この点において、Volcano Engine は、ターゲットを絞ったコンテンツ リスク検出エンジンの完全なセットを提供し、マルチモーダル コンテンツのサポート、多様なリスク モデル、およびリアルタイムのリスク評価機能を通じて、企業向けの包括的で効率的なリスク管理ソリューションを実現します。 。
その中で、マーケティング資料におけるリスクの多様性の問題に対処するために、検出エンジンには数百のリスク モデルが組み込まれています。たとえば、マーケティング コピーに適した広告用語検出モデルは、コピーに絶対的な用語、虚偽の宣伝、消費を誘発する違法なコンテンツが含まれているかどうかを正確に判断できます。一方、マーケティング ビデオに適した画質と著作権検出モデルは、コピーに含まれているかどうかを判断できます。絶対的な条件、虚偽の宣伝、消費を誘発する違法なコンテンツが含まれているかどうか、また侵害の可能性があるかどうか。
また、ターゲットユーザーを効果的にコンバージョンさせるために、企業はユーザーの定着率を高めるために、新人報酬やタスク報酬など、さまざまなマーケティング活動に多大な投資を行うことがよくあります。しかし、これらの魅力的な報酬メカニズムは、違法企業にとっては「太った肉」になる可能性もあり、彼らは抜け穴を利用して企業のマーケティング資金を騙し取ります。
たとえば、自動車会社がオンライン マーケティング活動を行ったとき、偽のサポートと偽の試乗という 2 つの厄介な問題に遭遇しました。 Volcano Engine インテリジェントリスク管理製品にアクセスした後、わずか 2 か月で 108 万件の異常な動作、3 万件以上の異常なアカウント、2 万台以上の異常なデバイスを特定し、直接のストップロス額は 50 万元に達しただけではありません。マーケティング費用の無駄が効果的に削減され、ビジネスの転換率も大幅に向上します。
NVIDIA エンタープライズ開発者コミュニティのシニア マネージャーである He Kun は、非常にクールなツールである NeMo Guardrails を紹介しました。これは、大規模な言語モデルがナンセンスな発言をするのを防ぐ「ボディーガード」のようなものです。
He Kun 氏によると、NeMo Guardrails は、機密性の高いトピック、不適切な発言、悪意のある攻撃を防ぐためのプログラム可能なガードレールを追加することで、大規模な言語モデルの出力を制御するオープンソース ツール ライブラリです。これには、トピック制限、会話セキュリティ、攻撃防御という 3 つの主要なガードレールが含まれており、カスタム会話ロジックをサポートし、会話ロボットの応答が特定のリクエストと事前定義されたロジックに確実に準拠するようにします。
NeMo ガードレールのワークフローには、ユーザー入力の受信、生成されたガードレールの照合、会話ロジック フローの実行、ボット回答の生成が含まれます。可読性とスケーラビリティに優れた会話型 AI モデリング用の言語である Colang を使用して会話ロジックを定義します。さらに、NeMo ガードレールを LangChain と組み合わせて使用すると、複数の大規模言語モデル対話エンジンをサポートし、より安全な対話システム出力を実現できます。
第 5 号のレビュー閲覧アドレス: https://vtizr.xetlk.com/s/7CjTy (または以下の QR コードを特定)。
報酬アンケート以上がAI は人間の画家がアート コンテストで 1 位を獲得するのに役立ちます。その秘密は何でしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。