CVPR 2024 | AI は、ダンス時のスカートの飛行を高度に復元することもでき、ダイナミックな人体レンダリングの新しいパラダイムを提案します。-AI-php.cn

ホームページ

テクノロジー周辺機器

CVPR 2024 | AI は、ダンス時のスカートの飛行を高度に復元することもでき、ダイナミックな人体レンダリングの新しいパラダイムを提案します。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 22, 2024 pm 02:37 PM

git プロジェクト動的人体再構成南洋理工大学

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。

日常の活動において、人の動きは衣服の二次的な動きを引き起こし、衣服のさまざまな折り目を生成することがよくあります。これには、人体と衣服の幾何学的形状と動き（人間の姿勢や速度力学など）を理解する必要があります。 .) と外観が同時に動的にモデル化されます。このプロセスには人と衣服の間の複雑で非剛的な物理的相互作用が含まれるため、従来の 3 次元表現では処理が困難なことがよくあります。

ビデオシーケンスからの動的なデジタルヒューマンレンダリングの学習は、近年大きく進歩しました。既存の手法では、「モーションエンコーダ-モーション特徴-外観」デコーダというパラダイムを使用して、レンダリングを人間の姿勢から画像へのニューラルマッピングとみなすことがよくあります。このパラダイムは、監視のための画像損失に基づいており、画像の各フレームの再構成に重点が置かれているため、「人体の動きや衣服に関連した動き」などの複雑な動きを効果的にモデル化することが困難です。」。

この問題を解決するために、シンガポールの南洋理工大学の S-Lab チームは、動きと外観の共同学習による動的人体再構築の新しいパラダイムを提案し、人体表面 (サーフェスベースのトライプレーン) は、運動物理モデリングと外観モデリングを 1 つのフレームワークに統合し、動的な人体のレンダリングの品質を向上させるための新しいアイデアを開きます。この新しいパラダイムは、衣服に付着した動きを効果的にモデル化し、動きの速いビデオ (ダンスなど) から動的な人体の再構築を学習し、動きに関連した影をレンダリングするために使用できます。レンダリング効率は 3D ボクセルレンダリング方式と比べて 9 倍高速で、LPIPS 画質は約 19 ポイント向上しています。

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

論文タイトル: SurMo: ダイナミックヒューマンレンダリングのためのサーフェスベースの4Dモーションモデリング
論文アドレス: https://arxiv.org/pdf/2404.01225.pdf
プロジェクトホームページ: https ://taohuumd.github.io/projects/SurMo
Github リンク: https://github.com/TaoHuUMD/SurMo

メソッドの概要

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

外観の再構築のみに焦点を当て、動きの連続性モデリングを無視した既存のパラダイム「モーションエンコーダ - モーション特徴 - 外観デコーダ」の欠点を目指して、新しいパラダイム SurMo が提案されています。「①モーションエンコーダ - モーション特徴 - ②モーションデコーダ、③外観」デコーダ"。上の図に示すように、パラダイムは 3 つの段階に分かれています:

疎な 3 次元空間での動きをモデル化する既存の手法とは異なり、SurMo は、人間の表面多様体フィールド (またはコンパクト) に基づいて提案します。 2 次元テクスチャ UV 空間) 4 次元 (XYZ-T) モーションモデリングであり、人体表面上に定義された 3 つの平面 (サーフェスベースのトリプレーン) を介してモーションを表します。
運動の空間的偏向などの現在の運動特性 (3 次元の姿勢、速度、運動軌道など) に基づいて次のフレームの運動状態を予測する運動物理デコーダーを提案します - 表面法線ベクトルと時間的偏向 - 速度、これは動きの特徴の連続性をモデル化します。
4 次元外観デコーディング、3 次元自由視点ビデオをレンダリングするための動き特徴の時間デコーディング。主にハイブリッドボクセル-テクスチャニューラルレンダリング (ハイブリッドボリューム-テクスチャレンダリング、HVTR [Hu et al. 2022]) を通じて実装されます。 .

SurMo は、再構成損失と敵対的損失のエンドツーエンドトレーニングに基づいて、ビデオから動的な人間のレンダリングを学習できます。

実験結果

この研究では、合計 9 つの動的な人間のビデオシーケンスを含む 3 つのデータセットに対して実験評価を実施しました: ZJU-MoCap [Peng et al 2021]、AIST++ [Li, Yang et al. .2021] MPII-RRDC [Habermann et al. 2021] .

この研究では、ZJU-MoCap データセット上の新しい視点のパフォーマンスを調査します。以下の図に示すように、時間シーケンス (時間的に変化する外観)、特に 2 つのシーケンスの影響が研究されます。各シーケンスには似たようなジェスチャが含まれていますが、①②、③④、⑤⑥のように異なる動作軌跡で表示されます。 SurMo は動作軌跡をモデル化できるため、時間の経過とともに変化する動的効果を生成できますが、関連する方法は姿勢のみに依存する結果を生成し、異なる軌跡の下でも衣服の折り目はほぼ同じになります。

モーション関連の影と衣服関連のモーションのレンダリング

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

SurMo は、以下の図に示すように、MPII-RRDC データセット上でモーション関連の影と衣服関連のモーションを調査しました。このシーケンスは屋内のサウンドステージで撮影され、照明条件により自己閉塞の問題により出演者に動きに関連した影が生じました。

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

SurMo では、これらの①②、③④、⑦⑧などの影を新しい視点レンダリングで復元することができます。対照的な方法である HumanNeRF [Weng et al.] は、動きに関連した影を回復できません。さらに、SurMo は、ジャンプ動作の折り目⑤⑥ など、動作軌道に応じて変化する服飾品の動作を再構築できますが、HumanNeRF はこの動的効果を再構築できません。

高速で動く人体のレンダリング

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

SurMo は、動きの速いビデオから人体をレンダリングし、対照的な方法ではレンダリングできないモーション関連の衣服の折り目の詳細も復元します。

アブレーション実験

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

(1) 人体の表面運動モデリング

この研究では、2つの異なる運動モデリング手法を比較しました:現在ボクセル空間(体積空間)で一般的に使用されている運動モデリング、および SurMo によって提案された人間の表面多様体フィールド (表面多様体) の運動モデリング、特にボリュームトリプレーンと表面ベースのトリプレーンを比較したものを以下の図に示します。

ボリュームトリプレーンは、レンダリングに使用されるフィーチャの約 21 ～ 35% のみがスパースな表現であるのに対し、サーフェスベースのトリプレーンフィーチャの使用率は 85% に達する可能性があるため、セルフオクルージョンの処理においてより多くの利点があることがわかります。 ( d) に示すように。同時に、サーフェスベースのトライプレーンは、図 (c) に示すように、ボクセルレンダリングでサーフェスから遠く離れた点をフィルタリングすることで、より高速なレンダリングを実現できます。

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

同時に、この研究は、上の図に示すように、サーフェスベースのトリプレーンは、トレーニングプロセス中にボリュメトリックトリプレーンよりも速く収束でき、衣服の折り目の詳細と自己オクルージョンにおいて明らかな利点があることを示しています。

(2) 動的学習

SurMo は、以下の図に示すように、アブレーション実験を通じてモーションモデリングの効果を研究しました。結果は、SurMo が動きの静的特性 (特定のフレームでの固定姿勢など) と動的特性 (速度など) を分離できることを示しています。たとえば、速度を変化させても、ぴったりとフィットした衣服の折り目は①のように変化しませんが、緩い衣服の折り目は②のように速度に大きく影響されます。これは日常の観察と一致しています。

CVPR 2024 | 跳舞时飞扬的裙摆，AI也能高度还原了，南洋理工提出动态人体渲染新范式

以上がCVPR 2024 | AI は、ダンス時のスカートの飛行を高度に復元することもでき、ダイナミックな人体レンダリングの新しいパラダイムを提案します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7450

CakePHP チュートリアル

1374

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

GOの浮動小数点番号操作に使用されるライブラリは何ですか？ Apr 02, 2025 pm 02:06 PM

GO言語の浮動小数点数操作に使用されるライブラリは、精度を確保する方法を紹介します...

Giteeページ静的なWebサイトの展開に失敗しました：単一のファイル404エラーをトラブルシューティングと解決する方法 Apr 04, 2025 pm 11:54 PM

GiteEpages静的Webサイトの展開が失敗しました：404エラーのトラブルシューティングと解像度Giteeを使用する

GOのどのライブラリが大企業によって開発されていますか、それとも有名なオープンソースプロジェクトによって提供されていますか？ Apr 02, 2025 pm 04:12 PM

大企業または有名なオープンソースプロジェクトによって開発されたGOのどのライブラリが開発されていますか？ GOでプログラミングするとき、開発者はしばしばいくつかの一般的なニーズに遭遇します...

海外バージョンの配送地域データを取得する方法は？利用可能な既製のリソースは何ですか？ Apr 01, 2025 am 08:15 AM

質問の説明：海外バージョンの配送地域データを取得する方法は？既製のリソースはありますか？国境を越えた電子商取引またはグローバル化ビジネスで正確に入手してください...

Redisストリームを使用してGO言語でメッセージキューを実装する場合、user_idタイプの変換の問題を解決する方法は？ Apr 02, 2025 pm 04:54 PM

redisstreamを使用してGo言語でメッセージキューを実装する問題は、GO言語とRedisを使用することです...

H5プロジェクトの実行方法 Apr 06, 2025 pm 12:21 PM

H5プロジェクトを実行するには、次の手順が必要です。Webサーバー、node.js、開発ツールなどの必要なツールのインストール。開発環境の構築、プロジェクトフォルダーの作成、プロジェクトの初期化、コードの書き込み。開発サーバーを起動し、コマンドラインを使用してコマンドを実行します。ブラウザでプロジェクトをプレビューし、開発サーバーURLを入力します。プロジェクトの公開、コードの最適化、プロジェクトの展開、Webサーバーの構成のセットアップ。