英伟达公布 Neuralangelo AI模型,可将视频内容转换为高精3D模型
IT之家 6 月 2 日消息,英伟达公司于本周宣布推出一款名为 Neuralangelo 的 AI 模型,该模型能够将视频片段转化为细节层次丰富、具备贴图的 3D 模型。
▲ 图源 英伟达
IT之家查询得知,此前也已经有数个基于视频内容生成 3D 模型的 AI,但这些 AI 往往在面对低对比度视频时便无法着手。而英伟达的 Neuralangelo 模型采用了即时神经绘图(instant neural graphics primitives),并利用了自家的 Instant NeRF 技术,因此即使是对于低对比度的视频,也可以从中捕捉到微妙的细节,并转换为更具备商业价值的 3D 模型。
▲ 图源 英伟达
英伟达强调,Neuralangelo 的独到之处主要表现在其“准确性”与“普适性”:
- “准确性”即该模型可以准确呈现复杂材料的质地,例如屋顶瓦片、玻璃窗格和光滑的大理石;
- “普适性”即创作者们能够简单使用智能手机拍摄的影片素材,即可创作出逼真的物件,并将其整合到他们的项目中。
▲ 图源 英伟达
Neuralangelo 模型利用从不同角度拍摄的物品的视频作为输入素材,来生成创作者们所需要的模型。一旦 Neuralangelo 确定了视频中相机的运动规律,它就会生成模型的 3D 轮廓,并开始在上面雕刻出细节。
▲ 图源 英伟达
预计英伟达将在 6 月 18 日至 22 日举行的电脑视觉与样式辨识(Computer Vision and Pattern Recognition,CVPR)大会上发布 Neuralangelo 模型。在内部演示中,英伟达展示了 Neuralangelo 模型重建的米开朗基罗著名雕刻作品《大卫》、英伟达位于湾区的办公室、及平板拖车等日常见到的物品的 3D 还原模型。
▲ 图源 英伟达
英伟达在会议上展示的模型除了 Neuralangelo,还包括名为DiffCollage的一款。DiffCollage 是一种能够通过文字提示词生成视频的 AI 模型,可以生成 360 度全景图像与循环动态图像,并再将这些图像扩展为具体的视频。
英伟达研究部高级主任、论文作者 Ming-Yu Liu 对这项研究的意义给出了畅想:
Neuralangelo 提供的 3D 重建能力将给创作者带来巨大好处,帮助他们在数字世界中重建真实世界。这个工具最终将使开发人员能够将精细的物体 —— 不论是小型雕像,还是大型建筑 —— 导入视频游戏或工业数字孪生的虚拟环境中。
IT之家的小伙伴们可以在这里找到论文的具体内容。
以上是英伟达公布 Neuralangelo AI模型,可将视频内容转换为高精3D模型的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

DALL-E 3:生成的AI图像创建工具 Generative AI正在彻底改变内容的创建,而Openai最新的图像生成模型Dall-E 3处于最前沿。它于2023年10月发行,建立在其前任Dall-E和Dall-E 2上

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

这项耗资5000亿美元的星际之门AI项目由OpenAI,Softbank,Oracle和Nvidia等科技巨头支持,并得到美国政府的支持,旨在巩固美国AI的领导力。 这项雄心勃勃

Google的VEO 2和Openai的Sora:哪个AI视频发电机占据了至尊? 这两个平台都产生了令人印象深刻的AI视频,但它们的优势在于不同的领域。 使用各种提示,这种比较揭示了哪种工具最适合您的需求。 t

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)
