目次
これまで、画像を 3D に変換する方法には、スコア蒸留サンプリング (SDS) が一般的に使用されていました。この方法の結果は素晴らしいものですが、マルチビューの不一致、過飽和、過度に平滑化されたテクスチャ、生成の遅さなど、いくつかの問題があります。
ホームページ テクノロジー周辺機器 AI 北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

Jan 10, 2024 pm 11:09 PM
画像 2d

写真を 3D に変換するのにかかる時間は 2 分です。

それは依然として、高いテクスチャ品質と複数の視野角での高い一貫性を備えた種類です。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

どんな種類であっても、入力時のシングルビュー画像は次のようになります。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

Two数分後、3D バージョンが完成します:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現##△上、Repaint123 (
NeRF

); 下、Repaint123 (GS)新しいメソッドは

Repaint123

と呼ばれます。中心となるアイデアは、2D 拡散モデルの強力な画像生成機能と再ペイント戦略のテクスチャ位置合わせ機能を組み合わせて、高品質で一貫した画像を生成することです。多視点からのイメージ。 さらに、この研究では、重複領域に対する可視性を考慮した適応型再ペイント強度手法も導入しています。

Repaint123は、これまでの多視点ずれが大きい、テクスチャの劣化、生成の遅さなどの問題点を一気に解決しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現# プロジェクト コードはまだ GitHub で公開されていませんが、100 人がコードをマークするために来ています:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現# # Repaint123 はどのようなものですか?

これまで、画像を 3D に変換する方法には、スコア蒸留サンプリング (SDS) が一般的に使用されていました。この方法の結果は素晴らしいものですが、マルチビューの不一致、過飽和、過度に平滑化されたテクスチャ、生成の遅さなど、いくつかの問題があります。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△上からinput、Zero123-XL、Magic123、Dream gaussian

これらの問題を解決するために、北京大学と彭城研究所から、シンガポール国立大学、武漢大学の研究者は Repaint123 を提案しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現一般に、Repaint123 には次のような貢献があります。

(1) Repaint123 は、画像から 3D への制御可能な再描画プロセスを包括的に考慮して生成します。高品質の画像シーケンスを生成し、これらの画像が複数の視野角にわたって一貫していることを確認します。

(2) Repaint123 は、シングルビュー 3D 生成のための単純なベースライン方法を提案しました。

大まかなモデルの段階では、Zero123 を 3D プリアとして使用し、SDS 損失関数と組み合わせて、ガウス スプラッティング ジオメトリを最適化することで大まかな 3D モデルを迅速に生成します (わずか 1 分)。

細かいモデルの段階では、2D プリアとして安定拡散を使用し、平均二乗誤差 (MSE) 損失関数と組み合わせて、メッシュ テクスチャ (これも 1 つだけ) を迅速に調整することで高品質の 3D モデルを生成します。分)。

(3) 多数の実験により、Repaint123 メソッドの有効性が証明されています。 1枚の画像からわずか2分で2D生成品質に匹敵する高品質な3Dコンテンツを生成できます。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△一貫性のある高品質な 3D のシングルビュー 3D 高速生成を実現

具体的な方法を見ていきましょう。

Repaint123 はメッシュ改良段階の最適化に焦点を当てており、その主な改善方向は、マルチビューの一貫性を備えた高品質のイメージ シーケンスの生成と、高速かつ高品質の 3D 再構成の達成という 2 つの側面をカバーしています。

1. 複数視点の一貫性のある高画質画像シーケンスの生成

複数視点の一貫性のある高画質画像シーケンスの生成は、次の 3 つに分けられます。パーツ:

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△複数の視点からの一貫した画像生成プロセス

DDIM 反転

ラフモデル段階での生成一貫した 3D 低周波テクスチャ情報を取得するために、作者は DDIM 反転を使用して画像を決定された潜在空間に反転し、その後のノイズ除去プロセスの基礎を築き、忠実で一貫した画像を生成します。

制御可能なノイズ除去

ノイズ除去段階で幾何学的一貫性と長距離テクスチャ一貫性を制御するために、著者は ControlNet を導入し、幾何学的事前分布として粗いモデルによってレンダリングされた深度マップを使用し、同時に、テクスチャ マイグレーションのリファレンス マップ。

さらに、分類子を使用しないガイダンスを実行して画質を向上させるために、この論文では CLIP を使用して参照画像を画像キューにエンコードし、ノイズ除去ネットワークをガイドします。

再描画

オクルージョンと重複部分のプログレッシブ再描画 画像シーケンス内の隣接する画像の重複領域がピクセル レベルで位置合わせされるようにするために、作成者はプログレッシブ ローカルを使用します。戦略を再描画します。

重なり合う領域はそのままに、調和のとれた隣接領域が生成され、基準視点から360°まで徐々に広がります。

しかし、以下の図に示すように、正視時には以前に斜視されていた領域の視覚解像度が大きくなり、より多くの高周波情報が必要になるため、著者は重複領域も調整する必要があることを発見しました。追加される。

さらに、間引き強度は 1-cosθ* に等しくなります。ここで、θ* は、以前のすべてのカメラ アングルと、表示された表面の法線ベクトルを使用して、重なり合う領域を適応的に再描画します。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現△カメラアングルと間引き強度の関係

品質を向上させながら忠実度を確保するための適切な間引き強度を選択するために、著者は以下から教訓を得ています。射影定理と画像超解像度の考え方に基づいて、重複領域を洗練するためのシンプルかつ直接的な可視性を意識した再描画戦略が提案されています。

2. 高速かつ高品質な 3D 再構成

下の図に示すように、著者は高速かつ高品質な 3D 再構成のプロセスで 2 つの方法を使用します。 . ステージアプローチ。

#△Repaint123 2 段階シングルビュー 3D 生成フレームワーク北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
まず、ガウス スプラッティング表現を利用して、合理的な幾何学的構造と粗いテクスチャを迅速に生成します。

同時に、以前に生成されたマルチビューの一貫した高品質画像シーケンスの助けを借りて、作成者は単純な平均二乗誤差

(MSE)

損失を使用して、高速な 3D テクスチャ再構築。

一貫性、品質、速度の最適化

研究者は、単一ビュー生成タスクの複数のアプローチを比較しました。

△シングルビュー 3D 生成視覚化の比較北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
RealFusion15 および Test-alpha データ セットでは、Repaint123 は一貫性、品質、速度の 3 つの結果を達成しました。パフォーマンス面で最も先進的なエフェクト。

#同時に、著者は論文で使用されている各モジュールの有効性と視点回転の増分に関するアブレーション実験も実施しました。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

##視野角間隔が 60 度の場合に性能がピークに達しますが、視野角間隔が広すぎると重なり合う面積が減少し、故障の可能性が高まることも分かりました。問題は多面的であるため、40 度を最適な視野角間隔として使用できます。

北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現
北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

論文アドレス: https://arxiv.org/pdf/2312.13271.pdf

コード アドレス: https:// pku-yuangroup.github.io/repaint123/北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現

プロジェクトアドレス: https://pku-yuangroup.github.io/repaint123/

以上が北京大学制作:テクスチャ品質とマルチビューの一貫性を備えた最新SOTA、2分で1枚の画像の3D変換を実現の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Windows 11でデスクトップの背景の最近の画像履歴をクリアする方法 Windows 11でデスクトップの背景の最近の画像履歴をクリアする方法 Apr 14, 2023 pm 01:37 PM

<p>Windows 11 ではシステムの個人設定が改善され、ユーザーが以前に行ったデスクトップの背景の変更の最近の履歴を表示できるようになりました。 Windows システム設定アプリケーションの個人設定セクションに入ると、さまざまなオプションが表示されます。背景の壁紙の変更もその 1 つです。ただし、システムに設定されている背景壁紙の最新の履歴を確認できるようになりました。これを見るのが嫌で、この最近の履歴を消去または削除したい場合は、この記事を読み続けてください。レジストリ エディターを使用してこれを行う方法の詳細を学ぶのに役立ちます。 </p><h2>レジストリ編集の使用方法

Windows スポットライトの壁紙画像を PC にダウンロードする方法 Windows スポットライトの壁紙画像を PC にダウンロードする方法 Aug 23, 2023 pm 02:06 PM

窓は決して美観を無視するものではありません。 XP の牧歌的な緑の野原から Windows 11 の青い渦巻くデザインに至るまで、デフォルトのデスクトップの壁紙は長年にわたってユーザーの喜びの源でした。 Windows スポットライトを使用すると、ロック画面やデスクトップの壁紙に使用する美しく荘厳な画像に毎日直接アクセスできるようになります。残念ながら、これらの画像は表示されません。 Windows スポットライト画像の 1 つが気に入った場合は、その画像をダウンロードして、しばらく背景として保存できるようにする方法を知りたいと思うでしょう。知っておくべきことはすべてここにあります。 Windowsスポットライトとは何ですか? Window Spotlight は、設定アプリの [個人設定] &gt から利用できる自動壁紙アップデーターです。

Python で画像セマンティック セグメンテーション テクノロジを使用するにはどうすればよいですか? Python で画像セマンティック セグメンテーション テクノロジを使用するにはどうすればよいですか? Jun 06, 2023 am 08:03 AM

人工知能技術の継続的な発展に伴い、画像セマンティックセグメンテーション技術は画像分析分野で人気の研究方向となっています。画像セマンティック セグメンテーションでは、画像内のさまざまな領域をセグメント化し、各領域を分類して、画像の包括的な理解を実現します。 Python はよく知られたプログラミング言語であり、その強力なデータ分析機能とデータ視覚化機能により、人工知能技術研究の分野で最初に選択されます。この記事では、Python で画像セマンティック セグメンテーション技術を使用する方法を紹介します。 1. 前提知識が深まる

iOS 17: 写真でワンクリックトリミングを使用する方法 iOS 17: 写真でワンクリックトリミングを使用する方法 Sep 20, 2023 pm 08:45 PM

iOS 17 の写真アプリを使用すると、Apple は写真を仕様に合わせて簡単にトリミングできるようになります。その方法については、読み続けてください。以前の iOS 16 では、写真アプリで画像をトリミングするにはいくつかの手順が必要でした。編集インターフェイスをタップし、トリミング ツールを選択し、ピンチでズームするジェスチャまたはトリミング ツールの角をドラッグしてトリミングを調整します。 iOS 17 では、Apple がありがたいことにこのプロセスを簡素化し、写真ライブラリで選択した写真を拡大すると、画面の右上隅に新しい切り抜きボタンが自動的に表示されるようになりました。クリックすると、選択したズームレベルで完全なトリミングインターフェイスが表示されるので、画像の好きな部分をトリミングしたり、画像を回転したり、画像を反転したり、画面比率を適用したり、マーカーを使用したりできます。

2D画像を使って3Dの人体を作成し、好きな服を着たり、動きを変えたりすることができます。 2D画像を使って3Dの人体を作成し、好きな服を着たり、動きを変えたりすることができます。 Apr 11, 2023 pm 02:31 PM

NeRF が提供する微分可能なレンダリングのおかげで、最近の 3D 生成モデルは静止したオブジェクトに対して素晴らしい結果を達成しました。ただし、人体のようなより複雑で変形可能なカテゴリでは、3D 生成には依然として大きな課題が伴います。この論文では、超解像度モデルを使用せずに高解像度 (512x256) の 3D 人体生成を可能にする、人体の効率的な組み合わせ NeRF 表現を提案します。 EVA3D は、4 つの大規模な人体データ セットに関する既存のソリューションを大幅に上回り、コードはオープンソースになっています。論文名: EVA3D: 2D 画像コレクションからの合成 3D 人間の生成 論文アドレス: http

Windows で PowerToys を使用して画像のサイズを一括変更する方法 Windows で PowerToys を使用して画像のサイズを一括変更する方法 Aug 23, 2023 pm 07:49 PM

日常的に画像ファイルを扱う必要がある人は、プロジェクトや仕事のニーズに合わせて画像ファイルのサイズを変更する必要があることがよくあります。ただし、処理する画像が多すぎる場合、画像を個別にサイズ変更すると、多くの時間と労力がかかる可能性があります。この場合、PowerToys のようなツールは、画像サイズ変更ユーティリティを使用して画像ファイルのサイズをバッチで変更するのに役立ちます。 Image Resizer 設定をセットアップし、PowerToys を使用して画像のバッチ サイズ変更を開始する方法は次のとおりです。 PowerToys を使用して画像のサイズをバッチ変更する方法 PowerToys は、日常業務のスピードアップに役立つさまざまなユーティリティと機能を備えたオールインワン プログラムです。そのユーティリティの 1 つは画像です

画像生成に関する新しい視点: NeRF ベースの一般化手法についての議論 画像生成に関する新しい視点: NeRF ベースの一般化手法についての議論 Apr 09, 2023 pm 05:31 PM

新しい透視画像生成 (NVS) は、コンピュータ ビジョンの応用分野です。1998 年のスーパーボウル ゲームで、CMU の RI は、マルチカメラ ステレオ ビジョン (MVS) を備えた NVS をデモンストレーションしました。当時、この技術は、米国のスポーツ テレビ局に移転されました。英国BBC放送社も研究開発に投資したが、結局は商品化されなかった。イメージベース レンダリング (IBR) の分野には、NVS アプリケーションの一分野、つまり深度イメージベース レンダリング (DBIR) があります。また、2010年に大流行した3Dテレビも単眼映像から両眼立体感を得る必要がありましたが、技術の未熟さから結局普及には至りませんでした。当時、次のような機械学習をベースとした手法が研究され始めていました。

ワンクリックでシミやシワを消す:DAMOアカデミーの高精細ポートレート肌美人モデルABPNの徹底解説 ワンクリックでシミやシワを消す:DAMOアカデミーの高精細ポートレート肌美人モデルABPNの徹底解説 Apr 12, 2023 pm 12:25 PM

デジタル文化産業の活発な発展に伴い、人工知能技術は画像編集や美化の分野で広く使用され始めています。その中でも、ポートレートの肌の美化は間違いなく最も広く使用され、最も需要のある技術の 1 つです。従来の美容アルゴリズムは、フィルターベースの画像編集テクノロジーを使用して、自動化された肌の再表面化とシミの除去効果を実現しており、ソーシャルネットワーキング、ライブブロードキャスト、その他のシナリオで広く使用されてきました。しかし、敷居の高いプロの写真業界では、画像解像度と品質基準に対する高い要件があるため、手動レタッチャーが依然として肖像画の美しさのレタッチにおいて主な生産力であり、肌の滑らかさ、シミの除去、美白などのタスクを完了します。仕事。通常、プロのレタッチャーによる高精細ポートレートの美肌処理の平均処理時間は1~2分ですが、より高い精度が要求される広告、映画、テレビなどの分野では、この処理が最適化されています。

See all articles