2D画像を使って3Dの人体を作成し、好きな服を着たり、動きを変えたりすることができます。
NeRF が提供する微分可能なレンダリングのおかげで、最近の 3D 生成モデルは静止したオブジェクトに対して素晴らしい結果を達成しました。ただし、人体のようなより複雑で変形可能なカテゴリでは、3D 生成には依然として大きな課題が伴います。この論文では、超解像度モデルを使用せずに高解像度 (512x256) の 3D 人体生成を可能にする、人体の効率的な組み合わせ NeRF 表現を提案します。 EVA3D は、4 つの大規模な人体データ セットに関する既存のソリューションを大幅に上回り、コードはオープンソースになっています。
- 論文名: EVA3D: 2D 画像コレクションからの合成 3D 人間の生成 ##論文アドレス: https://arxiv.org/abs/2210.04888
- プロジェクト ホームページ: https://hongfz16.github.io/projects/EVA3D.html
- オープン ソース コード: https://github.com/hongfz16/EVA3D
- Colab デモ: https://colab.research.google。 com/github/hongfz16/EVA3D/blob/main/notebook/EVA3D_Demo.ipynb
- ハグフェイスのデモ: https://huggingface.co/spaces/hongfz16/EVA3D
この問題を解決するために、この論文では、高解像度 (512x256) の 3D 人体 GAN トレーニングと生成を実現する、効率的な結合 3D 人体 NeRF 表現を提案します。この記事で提案する人間の NeRF 表現と 3 次元人間 GAN トレーニング フレームワークを以下に紹介します。
効率的な人間 NeRF 表現
この記事で提案する人間 NeRF は、人間の姿勢と形状の便利な制御を提供するパラメーター化された人体モデル SMPL に基づいています。 NeRF モデリングを行う場合、以下の図に示すように、この記事では人体を 16 の部分に分割します。各部分は、ローカル モデリング用の小規模な NeRF ネットワークに対応します。各部分をレンダリングするとき、この論文ではローカル NeRF について推論するだけで済みます。このスパース レンダリング方法では、より少ないコンピューティング リソースでネイティブの高解像度レンダリングを実現することもできます。たとえば、ボディおよびアクション パラメータが逆線形ブレンド スキニングである人体をレンダリングする場合、ポーズ空間のサンプリング ポイントを標準空間に変換します。次に、正準空間内のサンプリング ポイントが 1 つまたは複数のローカル NeRF 境界ボックスに属することが計算され、特定のサンプリング ポイントが複数のローカル NeRF 境界ボックスに分類される場合、NeRF モデルが推論されて各サンプリング ポイントに対応する色と濃度が取得されます。 NeRF オーバーラップ領域では、各 NeRF モデルが推論され、ウィンドウ関数を使用して複数の結果が補間され、最終的に、この情報は最終的なレンダリングを取得するための光の統合に使用されます。
3 次元人体 GAN フレームワーク
提案された効率的な人体 NeRF 表現に基づいて、この記事では 3 次元人体 GAN トレーニング フレームワークを実装します。各トレーニング反復において、この論文はまずデータセットから SMPL パラメータとカメラパラメータをサンプリングし、ランダムにガウス ノイズ z を生成します。この記事で提案した人体 NeRF を使用すると、サンプリングされたパラメータを偽のサンプルとして 2 次元の人体画像にレンダリングできます。この記事では、データセット内の実際のサンプルを使用して、GAN の敵対的トレーニングを実施します。
極端に不均衡なデータ セット
DeepFashion などの 2 次元の人体データ セットは、通常、それは 2 次元の視覚タスクのために準備されているため、人体の姿勢の多様性は非常に限られています。不均衡の程度を定量化するために、この論文では、DeepFashion におけるモデルの顔の向きの頻度を数えます。下図に示すように、オレンジ色の線はDeepFashionにおける顔の向きの分布を表しており、非常にアンバランスであり、三次元の人体表現の学習が困難であることがわかります。この問題を軽減するために、以下の図の他の色付きの線で示すように、分布曲線を平坦化するために人間の姿勢に基づいたサンプリング方法を提案します。これにより、モデルはトレーニング中に、人体のより多様で大きな角度の画像を見ることができるため、人体の 3 次元形状の学習に役立ちます。サンプリングパラメータの実験解析を行ったところ、以下の表から分かるように、人間姿勢誘導サンプリング手法を追加すると、画質(FID)は若干低下するものの、学習された三次元形状(Depth)は良好な結果が得られました。大幅に良くなりました。
高品質な生成結果
次の図は、EVA3D の生成結果の一部を示しています. EVA3D は人体の外観をランダムにサンプリングし、レンダリング カメラ パラメーターと人間の姿勢を制御できます。そして体型。
この論文では、DeepFashion、SHHQ、UBCFashion、および AIST という 4 つの大規模なヒト データ セットに対して実験を実施します。この研究では、最先端の静的 3D オブジェクト生成アルゴリズム EG3D と StyleSDF を比較します。同時に研究者らは、3D 人間生成に特化したアルゴリズム ENARF-GAN も比較しました。この記事では、指標の選択において、レンダリング品質 (FID/KID)、人体制御の精度 (PCK)、およびジオメトリ生成の品質 (Depth) の評価を考慮します。以下の図に示すように、この記事はすべてのデータセットとすべての指標において以前のソリューションを大幅に上回っています。
最後に、この記事では EVA3D の応用可能性についてもいくつか示します。まず、この研究では潜在空間における差分をテストしました。以下の図に示すように、この記事では 3 次元の 2 人の人物間のスムーズな切り替えが可能であり、中間結果も高い品質を維持しています。さらに、この記事では、2次元 GAN インバージョンで一般的に使用されるアルゴリズムである Pivotal Tuning Inversion を使用した GAN インバージョンの実験も実施しました。下の右の図に示すように、この方法では再構成されたターゲットの外観をより適切に復元できますが、幾何学的部分の多くの詳細が失われます。 3次元GANの反転は依然として非常に困難な課題であることがわかります。
以上が2D画像を使って3Dの人体を作成し、好きな服を着たり、動きを変えたりすることができます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









<p>Windows 11 ではシステムの個人設定が改善され、ユーザーが以前に行ったデスクトップの背景の変更の最近の履歴を表示できるようになりました。 Windows システム設定アプリケーションの個人設定セクションに入ると、さまざまなオプションが表示されます。背景の壁紙の変更もその 1 つです。ただし、システムに設定されている背景壁紙の最新の履歴を確認できるようになりました。これを見るのが嫌で、この最近の履歴を消去または削除したい場合は、この記事を読み続けてください。レジストリ エディターを使用してこれを行う方法の詳細を学ぶのに役立ちます。 </p><h2>レジストリ編集の使用方法

窓は決して美観を無視するものではありません。 XP の牧歌的な緑の野原から Windows 11 の青い渦巻くデザインに至るまで、デフォルトのデスクトップの壁紙は長年にわたってユーザーの喜びの源でした。 Windows スポットライトを使用すると、ロック画面やデスクトップの壁紙に使用する美しく荘厳な画像に毎日直接アクセスできるようになります。残念ながら、これらの画像は表示されません。 Windows スポットライト画像の 1 つが気に入った場合は、その画像をダウンロードして、しばらく背景として保存できるようにする方法を知りたいと思うでしょう。知っておくべきことはすべてここにあります。 Windowsスポットライトとは何ですか? Window Spotlight は、設定アプリの [個人設定] > から利用できる自動壁紙アップデーターです。

人工知能技術の継続的な発展に伴い、画像セマンティックセグメンテーション技術は画像分析分野で人気の研究方向となっています。画像セマンティック セグメンテーションでは、画像内のさまざまな領域をセグメント化し、各領域を分類して、画像の包括的な理解を実現します。 Python はよく知られたプログラミング言語であり、その強力なデータ分析機能とデータ視覚化機能により、人工知能技術研究の分野で最初に選択されます。この記事では、Python で画像セマンティック セグメンテーション技術を使用する方法を紹介します。 1. 前提知識が深まる

iOS 17 の写真アプリを使用すると、Apple は写真を仕様に合わせて簡単にトリミングできるようになります。その方法については、読み続けてください。以前の iOS 16 では、写真アプリで画像をトリミングするにはいくつかの手順が必要でした。編集インターフェイスをタップし、トリミング ツールを選択し、ピンチでズームするジェスチャまたはトリミング ツールの角をドラッグしてトリミングを調整します。 iOS 17 では、Apple がありがたいことにこのプロセスを簡素化し、写真ライブラリで選択した写真を拡大すると、画面の右上隅に新しい切り抜きボタンが自動的に表示されるようになりました。クリックすると、選択したズームレベルで完全なトリミングインターフェイスが表示されるので、画像の好きな部分をトリミングしたり、画像を回転したり、画像を反転したり、画面比率を適用したり、マーカーを使用したりできます。

日常的に画像ファイルを扱う必要がある人は、プロジェクトや仕事のニーズに合わせて画像ファイルのサイズを変更する必要があることがよくあります。ただし、処理する画像が多すぎる場合、画像を個別にサイズ変更すると、多くの時間と労力がかかる可能性があります。この場合、PowerToys のようなツールは、画像サイズ変更ユーティリティを使用して画像ファイルのサイズをバッチで変更するのに役立ちます。 Image Resizer 設定をセットアップし、PowerToys を使用して画像のバッチ サイズ変更を開始する方法は次のとおりです。 PowerToys を使用して画像のサイズをバッチ変更する方法 PowerToys は、日常業務のスピードアップに役立つさまざまなユーティリティと機能を備えたオールインワン プログラムです。そのユーティリティの 1 つは画像です

NeRF が提供する微分可能なレンダリングのおかげで、最近の 3D 生成モデルは静止したオブジェクトに対して素晴らしい結果を達成しました。ただし、人体のようなより複雑で変形可能なカテゴリでは、3D 生成には依然として大きな課題が伴います。この論文では、超解像度モデルを使用せずに高解像度 (512x256) の 3D 人体生成を可能にする、人体の効率的な組み合わせ NeRF 表現を提案します。 EVA3D は、4 つの大規模な人体データ セットに関する既存のソリューションを大幅に上回り、コードはオープンソースになっています。論文名: EVA3D: 2D 画像コレクションからの合成 3D 人間の生成 論文アドレス: http

新しい透視画像生成 (NVS) は、コンピュータ ビジョンの応用分野です。1998 年のスーパーボウル ゲームで、CMU の RI は、マルチカメラ ステレオ ビジョン (MVS) を備えた NVS をデモンストレーションしました。当時、この技術は、米国のスポーツ テレビ局に移転されました。英国BBC放送社も研究開発に投資したが、結局は商品化されなかった。イメージベース レンダリング (IBR) の分野には、NVS アプリケーションの一分野、つまり深度イメージベース レンダリング (DBIR) があります。また、2010年に大流行した3Dテレビも単眼映像から両眼立体感を得る必要がありましたが、技術の未熟さから結局普及には至りませんでした。当時、次のような機械学習をベースとした手法が研究され始めていました。

デジタル文化産業の活発な発展に伴い、人工知能技術は画像編集や美化の分野で広く使用され始めています。その中でも、ポートレートの肌の美化は間違いなく最も広く使用され、最も需要のある技術の 1 つです。従来の美容アルゴリズムは、フィルターベースの画像編集テクノロジーを使用して、自動化された肌の再表面化とシミの除去効果を実現しており、ソーシャルネットワーキング、ライブブロードキャスト、その他のシナリオで広く使用されてきました。しかし、敷居の高いプロの写真業界では、画像解像度と品質基準に対する高い要件があるため、手動レタッチャーが依然として肖像画の美しさのレタッチにおいて主な生産力であり、肌の滑らかさ、シミの除去、美白などのタスクを完了します。仕事。通常、プロのレタッチャーによる高精細ポートレートの美肌処理の平均処理時間は1~2分ですが、より高い精度が要求される広告、映画、テレビなどの分野では、この処理が最適化されています。
