NVIDIA、ビデオコンテンツを高精度の3Dモデルに変換できるNeuralangelo AIモデルを発表
IT House News 6 月 2 日、Nvidia は今週、ビデオ クリップを詳細レベルとテクスチャの豊富な 3D モデルに変換できる Neuralangelo と呼ばれる AI モデルのリリースを発表しました。
▲ 画像ソース NVIDIA
IT House が問い合わせたところ、ビデオ コンテンツに基づいて 3D モデルを生成する AI がいくつかあることがわかりましたが、これらの AI はコントラストの低いビデオに直面すると起動できないことがよくあります。 NVIDIA の Neuralangelo モデルは、インスタント ニューラル グラフィックス プリミティブを使用し、独自のインスタント NeRF テクノロジを活用しているため、コントラストの低いビデオでも微妙なディテールをキャプチャして、より商業的な価値のある 3D モデルに変換できます。
▲ 画像ソース NVIDIA
NVIDIA は、Neuralangelo の独自性が主にその「精度」と「汎用性」に反映されていることを強調します。
- 「精度」とは、モデルが屋根瓦、ガラス板、滑らかな大理石などの複雑なマテリアルのテクスチャを正確に表現できることを意味します。 「ユニバーサル」とは、クリエイターがスマートフォンで撮影したビデオ映像を使用するだけでリアルなオブジェクトを作成し、それを自分のプロジェクトに組み込むことができることを意味します。
Neuralangelo モデルは、さまざまな角度から撮影したアイテムのビデオを入力素材として使用し、クリエイターが必要とするモデルを生成します。 Neuralangelo がビデオ内のカメラの動きを決定すると、モデルの 3D アウトラインを生成し、その上に詳細を彫刻し始めます。
Nvidia は、6 月 18 日から 22 日まで開催される Computer Vision and Pattern Recognition (CVPR) カンファレンスで Neuralangelo モデルをリリースする予定です。 NVIDIA は社内デモンストレーションで、Neuralangelo モデルで復元されたミケランジェロの有名な彫刻「ダビデ像」、ベイエリアにある NVIDIA のオフィス、フラットベッド トレーラーなどの日用品の 3D 復元モデルを展示しました。
Neuralangelo に加えて、Nvidia がカンファレンスで展示したモデルには、DiffCollage と呼ばれるモデルも含まれていました。 DiffCollage は、テキスト プロンプトを通じてビデオを生成できる AI モデルで、360 度のパノラマ画像やループするダイナミック画像を生成し、これらの画像を特定のビデオに展開できます。
NVIDIA Research のシニア ディレクターであり、この論文の著者である Ming-Yu Liu は、この研究の重要性について次のように述べています。
Neuralangelo が提供する 3D 再構築機能は、クリエイターに多大なメリットをもたらし、デジタル世界で現実世界を再構築するのに役立ちます。このツールにより、開発者は最終的に、小さな彫像であれ、大きな建物であれ、詳細なオブジェクトをビデオ ゲームや産業用デジタル ツインの仮想環境にインポートできるようになります。
IT House の友人は、この論文の具体的な内容をここで見つけることができます。
以上がNVIDIA、ビデオコンテンツを高精度の3Dモデルに変換できるNeuralangelo AIモデルを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Dall-E 3:生成AI画像作成ツール 生成AIはコンテンツの作成に革命をもたらし、Openaiの最新の画像生成モデルであるDall-E 3が最前線にあります。 2023年10月にリリースされ、前任者のDall-EとDall-E 2に基づいています

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)
