


カード1枚で30秒でバーチャル3D嫁をゲット! Text to 3D は、毛穴の詳細が明確な高精度のデジタル ヒューマンを生成し、Maya、Unity、その他の制作ツールとシームレスに接続します
ChatGPT は AI 業界に鶏の血を注入しました。かつては想像もできなかったすべてのことが、今日では基本的な慣行になりました。
は Text-to-3D を継続的に進めており、Diffusion(image) や GPT(text) に続くものと考えられています。 AIGC 分野における次のフロンティアのホットスポットは、前例のない注目を集めています。
いいえ、ChatAvatar という製品が控えめなパブリック ベータ版として公開されました。すぐに 700,000 回を超えるビューと注目を集め、ホット (今週のスペース) に掲載されました。 。
△ChatAvatar は、AI で生成された単一視点/複数視点のオリジナルの絵画から 3D 様式化されたキャラクターを生成する Image to 3D テクノロジーもサポートします。
#現在のベータ版で生成された 3D モデルは、PBR 素材とともにローカルに直接ダウンロードできます。うまく機能するだけでなく、さらに重要なのは、無料でプレイできるということです。一部のネチズンは次のように叫びました。
とてもクールです。独自のデジタル ツインを簡単に生成できるような気がします。
ChatAvatar と呼ばれ、国内の AI スタートアップ企業である Yingmo Technology Team によって作成されました。
これは、世界初の Production-Ready Text to 3D 製品であることがわかり、スターの名前や希望のキャラクターの外観などの単純なテキストを通じて、映画やテレビのレベルを生成できます。画像 3D の超現実的なデジタル人的資産。 効率も非常に高く、自分の顔であっても本物に見える顔を作成するのにかかる時間は平均 30 秒です。 将来的には、生成分野は他の 3 次元アセットにも拡大される予定です。 そして、モデルには通常のトポロジ、4k 解像度の PBR マテリアル、バインディングがあり、Unity、Unreal Engine、Maya などのプロダクション エンジンのプロダクション パイプラインに直接接続できます。 それでは、ChatAvatarとはどのような3D生成ツールなのでしょうか?その背後にはどのようなテクノロジーが使用されているのでしょうか? 「スキンのペイント」を 30 秒で完了 ChatAvatar のゲームプレイを実際に体験してみると、まさに敷居ゼロと言えることがわかります。 具体的には、チャットボットへの要望を公式ウェブサイト上で会話形式で現地語で説明するだけで済みます。オンデマンドで 3D 顔を生成し、ステッカーで覆うことができます。モデルの本物の「人肌」。
会話プロセス全体を通じて、ChatBot はユーザーのニーズに応じてガイドを行い、必要なモデルに関するユーザーの考えをできるだけ詳細に理解します。
## マウスを使用してドラッグしたり、頭を回転させたり、ズームインしてローカルの詳細を確認したりすることもできます。効果、毛穴、ニキビがはっきりと見えます:
ユーザーがプロンプト エンジニアリングの専門家である場合は、左側のボックスに「プロンプト」と直接入力して生成を完了することもできることに注意してください。
最後に、ワンクリックでダウンロードするだけで、プロダクション エンジンに直接接続して駆動できる 3D デジタル ヘッド アセットを取得できます。ベータ版 ヘアスタイル機能はまだ提供されていませんが、全体として、最終的に生成された 3D デジタル人財と説明コンテンツの一致度は高いです。
公式 Web サイトには、ChatAvatar ユーザーによって生成された、さまざまな人種、肌の色、さまざまな年齢、喜び、怒り、悲しみ、美しさ、醜い、太った、やせた、あらゆる種類の外観を備えた多数のアセットも表示されます。
3D デジタル ヒューマン アセットを生成するための ChatAvatar 製品のハイライトを要約しましょう:
まず第一に、使いやすいです
生成スパンが大きく、顔の特徴を変更することができ、
のように顔に合わせたマスクやタトゥーなども生成できます。##公式によると、プロモーション ビデオによると、ChatAvatar は、アバターなどの映画やテレビ作品のキャラクターなど、人間の範囲を超えたキャラクターをさらに生成することができます。
#最も重要なことは、ChatAvatar3D モデルと従来のレンダリング ソフトウェアの間の互換性の問題を解決するです。
これは、ChatAvatar によって生成された 3D アセットを、ゲーム、映画、テレビの制作プロセスに直接統合できることを意味します。 もちろん、ChatAvatar は、産業プロセスに正式に関与する前に、パブリック ベータの第 1 ラウンドに参加するようすでに何千人ものアーティストやプロのアート関係者を集めており、Twitter 上の関連トピックは 100 万近くのビューを獲得しています。そして注意。
どのツイートも 50,000 回以上再生される可能性があります。
無駄に「水道水」を溜め込んでしまったアインシュタインの3D顔を見てください、本当に似ていると言わざるを得ません。 ?
ControlNet と組み合わせると、直接撮影した一眼レフ写真と同等の効果が得られます:実際、3D 業界の以前のデザイナーや企業にとって、ほとんどの AI テキストから 3D へのアプリケーションは効果がないわけではありませんが、実際に工業デザインのプロセスに実装するには依然として多くの困難があります。
ChatAvatar が今回これほど大きな話題を呼び起こした背後にある技術的な理由は何ですか?
業界の要件を満たす 3D アセットを生成する際の難しさは何ですか?
AI が人間に取って代わると言われていますが、実際のところ、Text-to-3D の分野だけを置き換えるのはそう簡単ではありません。
最大の困難は、AI によって生成されたものを
標準 の 3D アセットに対する業界の要件を満たすようにすることです。
業界標準
をどのように理解していますか?プロの 3D アート デザインの観点から見ると、品質、制御性、生成速度という少なくとも 3 つの側面があります。1つ目は品質です。特に視覚効果を重視する映画、テレビ、ゲーム業界では、パイプラインの要件を満たす 3D アセットを生成するために、トポロジカルな規則性やテクスチャ マッピングの精度などの「業界の暗黙のルール」が AI 製品にとって最初に実行する必要があります。ほーむ。
トポロジ構造の規則性を例に挙げると、これは基本的に 3D アセットの配線の合理性を指します。
3D アセットの場合、トポロジの規則性は、オブジェクトのアニメーション効果、変更処理効率、テクスチャ描画速度に直接影響することがよくあります。
業界における 3D アート デザインの導入によると、 、手動リトポロジー 時間コストは、たとえ複数であっても 3D モデル自体の制作よりも高くなることがよくあります。これは、AIモデルによって生成された3Dアセットがどんなに素晴らしくても、生成された位相規則性が要件を満たしていなければ、根本的なコスト削減はできないことを意味します。テクスチャの正確さは言うまでもありません。
△Yingmo Technology の ChatAvatar プロジェクトは、生成品質、速度、標準互換性の点で以前の作品と比べて大幅に向上しました
Take一例として、現在ゲーム、映画、テレビ業界で一般的に必要とされている PBR テクスチャには、2D 画像 PSD ファイルの「レイヤー」に相当する、反射率マップや法線マップなどの一連のテクスチャが含まれています。 3D アセット パイプラインの制作に不可欠な数少ない条件の 1 つです。
しかし、現在のAIによって生成される3Dアセットは「全体」であることが多く、産業環境に合わせたPBRテクスチャを必要に応じて独自に生成できることは稀です。
2 つ目は制御性です。生成 AI の場合、生成されたコンテンツをどのようにしてより「制御しやすく」するかが、このテクノロジーに対する CG 業界のもう 1 つの主要な要件です。
有名な 2D 業界を例に挙げると、ControlNet が登場するまで、2D AIGC 業界は「半暗い進歩」の状態にありました。
つまり、AIは指定されたカテゴリの物体の画像を生成することはできますが、指定された姿勢の物体を生成することはできず、その生成効果はもっぱら迅速なエンジニアリングと「形而上学」に依存します。
ControlNet の登場以降、2D AI 画像生成の制御性は飛躍的に向上しましたが、3D AI に関しては、対応する効果を備えたアセットを生成するために、依然としてプロの Prompt 作品に大きく依存しています。 。
最後に生成速度です。 3D アート デザインと比較すると、AI 生成の利点は速度にありますが、AI レンダリングの速度と効果が手動レンダリングに匹敵しない場合、この技術は依然として業界に利益をもたらすことができません。
現在 AI 技術として非常に普及している NeRF を例にとると、その産業化には速度と品質の互換性の問題が発生しています。
NeRFによる3D生成は、生成品質が高いと時間がかかることが多いですが、速度を追求するとNeRFで生成した3Dアセットでも産業利用に全くなりません。
しかし、たとえこの問題が解決されたとしても、精度を損なうことなく NeRF を従来の CG 業界の主流エンジンと互換性を持たせる方法は依然として大きな問題です。
上記の業界標準化プロセスから、2 つの大きなボトルネックがあることを見つけるのは難しくありません。:
1 1 つは、プロンプト プロジェクトを手動で完了する必要があり、AI 以外の専門家や AI を理解していないデザイナーにとっては十分に使いにくいこと、もう 1 つは、生成された 3D アセットが業界標準を満たしていないことが多く、使用できないことです。彼らがどんなに美しくても。
これら 2 つの点を考慮して、ChatAvatar は に 2 つの具体的で効果的な解決策を提供しました。
ChatAvatar は、手動入力プロンプト エンジニアリング以外の第 2 の道を実現する一方で、「パーティ A モード」による直接対話を通じてニーズを説明するという、より一般の人に適した近道でもあります。
チームの公式 Twitter によると、この機能を実現するために、ChatAvatar は GPT の機能に基づいて会話の説明をポートレート機能に変換する方法を開発しました。
デザイナーは、GPT とチャットを続けて、必要な「フィーリング」を説明するだけで済みます。
GPT は、プロンプト プロジェクトの完了と結果の表示を自動的に支援します。 AI への提供:
# つまり、ControlNet が 2D 業界の「ゲーム チェンジャー」である場合、3D 業界にとっては、ChatAvatar はテキストを 3D に変換できます。は業界にとってまさにゲームチェンジャーです。
一方、より重要なことは、ChatAvatar が CG パイプラインと完全に互換性があること、つまり、生成されたアセットがトポロジー、制御性、速度の点で業界の要件を満たしていることです。
これは、3D アセットの生成後、ダウンロードしたコンテンツを さまざまなポストプロダクション ソフトウェアに直接インポートして二次編集を行うことができ、より高い制御性を実現できることを意味するだけではありません。 、生成されたモデルと高精度のマテリアル マップは、後のレンダリングで非常にリアルなレンダリング効果を実現することもできます。
このような効果を実現するために、チームは ChatAvatar 用の進歩的な 3D 生成フレームワーク DreamFace を開発しました。鍵となるのは、モデルのトレーニングに使用される基礎となるデータです。これは、世界初の大規模で高精度、複数の表情の顔の高精度データセットです。 。
このデータセットに基づいて、DreamFace は 製品レベルの 3 次元アセット の生成を効率的に完了できます。つまり、生成されたアセットには規則的なトポロジ、マテリアル、およびバインディングが含まれます。
DreamFace には主に、ジオメトリ生成、物理ベースのマテリアル拡散、アニメーション機能生成の 3 つのモジュールが含まれています。 DreamFace は、外部 3D データベースを導入することで、CG プロセスに準拠したアセットを直接出力できます。
#△生成されたアセットドリブン レンダリングの効果
上記 2 つの主要な問題を解決する本質技術的なボトルネックAIGCの激流によって時代の流れはさらに加速し、「検索」は「世代」に取って代わられる -
△ChatAvatar プロジェクトのホームページ
Yingmu Technology CTO Zhang Qixuan が次のように紹介しました:
文生图
分野が拡散モデルによって成果を上げたとき、人々はテキスト生成3D
にも同様の驚くべきパフォーマンスを期待し始めました。生成AIの3D制作技術が成熟すると、VRや動画などのコンテンツ制作が本格化します。
△拡散モデルMidjourney5.1
その背後にある AI スタートアップ企業 Yingmu Technology は、2020 年に上海科技大学の MARS 研究室から設立されました。設立後、Qiji Chuangtan と Sequoia から 2 ラウンドの投資を受けました種子。
同社は、コンピューター グラフィックスと生成 AI の研究と製品化に重点を置いています。 2021年、AIGCが大きな波紋を起こす前に、同社は中国初のAIGC ToCペイントアプリケーションであるWandをすでにローンチしており、この製品はAppStoreパーティションでトップになったこともあった。
そして、この先進的なチームはすでに業界ではよく知られており、平均年齢はわずか 25 歳です。
最初の商品化シナリオをデジタル担当者に具体的に据えた後、ChatAvatar は、AIGC を活用したこの方向への最新の進歩です。
ChatAvatar は、新しく発売された製品として、互換性、完成度、精度などの製品効果の点で Yingmo チームの期待を上回りました。しかし、ウー・ディさんの言葉を借りれば、ここに至るまでの過程は「非常に恥ずかしい」ものであったという。
最大の理由は「人手不足」に他なりません。現在、Shadow Eye はマルチカテゴリー 3D 生成技術の進歩を遂げており、次のステップは「3D 生成された大型モデル」を開始することです。
以上がカード1枚で30秒でバーチャル3D嫁をゲット! Text to 3D は、毛穴の詳細が明確な高精度のデジタル ヒューマンを生成し、Maya、Unity、その他の制作ツールとシームレスに接続しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

上記と著者の個人的な理解 3 次元ガウシアンプラッティング (3DGS) は、近年、明示的な放射線フィールドとコンピューター グラフィックスの分野で出現した革新的なテクノロジーです。この革新的な方法は、数百万の 3D ガウスを使用することを特徴とし、主に暗黙的な座標ベースのモデルを使用して空間座標をピクセル値にマッピングする神経放射線場 (NeRF) 方法とは大きく異なります。明示的なシーン表現と微分可能なレンダリング アルゴリズムにより、3DGS はリアルタイム レンダリング機能を保証するだけでなく、前例のないレベルの制御とシーン編集も導入します。これにより、3DGS は、次世代の 3D 再構築と表現にとって大きな変革をもたらす可能性のあるものとして位置付けられます。この目的を達成するために、私たちは 3DGS 分野における最新の開発と懸念について初めて体系的な概要を提供します。

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

0.前面に書かれています&& 自動運転システムは、さまざまなセンサー (カメラ、ライダー、レーダーなど) を使用して周囲の環境を認識し、アルゴリズムとモデルを使用することにより、高度な知覚、意思決定、および制御テクノロジーに依存しているという個人的な理解リアルタイムの分析と意思決定に。これにより、車両は道路標識の認識、他の車両の検出と追跡、歩行者の行動の予測などを行うことで、安全な運行と複雑な交通環境への適応が可能となり、現在広く注目を集めており、将来の交通分野における重要な開発分野と考えられています。 。 1つ。しかし、自動運転を難しくしているのは、周囲で何が起こっているかを車に理解させる方法を見つけることです。これには、自動運転システムの 3 次元物体検出アルゴリズムが、周囲環境にある物体 (位置を含む) を正確に認識し、記述することができる必要があります。

ChatGPT と Python の完璧な組み合わせ: インテリジェント カスタマー サービス チャットボットの作成 はじめに: 今日の情報化時代において、インテリジェント カスタマー サービス システムは企業と顧客の間の重要なコミュニケーション ツールとなっています。より良い顧客サービス体験を提供するために、多くの企業が顧客相談や質問応答などのタスクを完了するためにチャットボットに注目し始めています。この記事では、OpenAI の強力なモデル ChatGPT と Python 言語を使用して、インテリジェントな顧客サービス チャットボットを作成し、顧客サービスを向上させる方法を紹介します。

インストール手順: 1. ChatGTP ソフトウェアを ChatGTP 公式 Web サイトまたはモバイル ストアからダウンロードします; 2. それを開いた後、設定インターフェイスで言語を中国語を選択します; 3. ゲーム インターフェイスでヒューマン マシン ゲームを選択し、中国スペクトル; 4 . 起動後、チャット ウィンドウにコマンドを入力してソフトウェアを操作します。

前に書かれたプロジェクトのリンク: https://nianticlabs.github.io/mickey/ 2 枚の写真が与えられた場合、それらの写真間の対応関係を確立することで、それらの間のカメラのポーズを推定できます。通常、これらの対応は 2D 対 2D であり、推定されたポーズはスケール不定です。いつでもどこでもインスタント拡張現実などの一部のアプリケーションでは、スケール メトリクスの姿勢推定が必要なため、スケールを回復するために外部深度推定器に依存します。この論文では、3D カメラ空間でのメトリックの対応を予測できるキーポイント マッチング プロセスである MicKey を提案します。画像全体の 3D 座標マッチングを学習することで、相対的なメトリックを推測できるようになります。

この記事では、ChatGPT と Java を使用してインテリジェントなチャットボットを開発する方法を紹介し、いくつかの具体的なコード例を示します。 ChatGPT は、OpenAI によって開発された生成事前トレーニング トランスフォーマーの最新バージョンです。これは、自然言語を理解し、人間のようなテキストを生成できるニューラル ネットワーク ベースの人工知能テクノロジーです。 ChatGPT を使用すると、適応型チャットを簡単に作成できます
