有望取代Deepfake?揭秘今年最火的NeRF技术有多牛
什么,你还不知道NeRF?
作为今年计算机视觉领域最火的AI技术,NeRF可谓是应用广泛,前景一片大好。
B站上的小伙伴可算是把这项技术玩出了新花样。
抛砖引玉
那么,究竟NeRF是什么?
NeRF(Neural Radiance Fields)是最早在2020年ECCV会议上的最佳论文中提出的概念,其将隐式表达推上了一个新的高度,仅用2D的posed images作为监督,即可表示复杂的三维场景。
一石激起千层浪,自此之后NeRF迅速发展起来被应用到多个技术方向,如「新视点合成、三维重建」等。
NeRF其输入稀疏的多角度带pose的图像训练得到一个神经辐射场模型,根据这个模型可以渲染出任意视角下的清晰的照片,如下图所示。也可以简要概括为用一个MLP去隐式地学习一个三维场景。
网友自然而然地也会将NeRF与同样大受追捧的Deepfake做个比较。
最近MetaPhysics发布的一篇文章就盘点了NeRF的进化史、面临的挑战和优势,并预测NeRF最终将取代Deepfake。
大部分有关deepfake技术引人注目的话题,是指自17年deepfakes进入大众视野后开始流行的两个开源软件包:DeepFaceLab (DFL) 和FaceSwap。
尽管这两个软件包都拥有广泛的用户群和活跃的开发者社区,但这两个项目与GitHub代码都没有明显的偏离。
当然,DFL和FaceSwap的开发人员并没有闲着:现在可以使用更大的输入图像来训练deepfake模型,尽管这需要更昂贵的GPU。
但其实在过去的三年里,媒体鼓吹的deepfake图像质量提升主要还是得归功于终端用户。
他们在数据收集方面积累了「省时而难得」的经验,以及训练模型的最佳方法(有时单次实验就需要几周时间),并且学会如何利用和扩展原始2017代码的最外层限制。
VFX和ML研究社区中的一些人正试图通过扩展架构来突破流行的deepfake包的「硬限制」,以便机器学习模型可以在高达1024×1024的图像上进行训练。
其像素是DeepFaceLab或FaceSwap当前实际范围的两倍,更接近于电影和电视制作中有用的分辨率。
接下来让我们一起了解一下NeRF吧~
揭开面纱
NeRF(Neural Radiance Fields),它出现于2020年,是一种通过在神经网络内拼接多个视点照片实现重建物体和环境的方法。
它通过使用稀疏的输入视图集优化底层连续的体积场景函数,实现了综合复杂场景视图的最好结果。
该算法还使用全连接深度网络表示一个场景,其输入是单个连续的5D坐标(空间位置(x, y, z)和观看方向(θ, φ)),其输出是该空间位置的体积密度和相关的发射幅亮度。
通过沿着相机光线查询5D坐标来合成视图,并使用经典的体绘制技术(volume rendering)将输出的颜色和密度投影到图像中。
实现过程:
首先将一个连续的场景表示为一个5D向量值函数,其输入是一个3D位置和2D观看方向,对应的输出是一个发射颜色c和体积密度σ。
在实践中,采用3D笛卡尔单位向量d表示方向。利用用MLP网络近似这个连续的5D场景表示,并优化其权重。
此外,通过限制网络来预测体积密度σ作为位置x的函数,同时还允许RGB颜色c作为位置和观看方向的函数进行预测,从而鼓励表示多视图一致。
为了实现这一点,MLP首先处理输入的具有8个全连接层的3D坐标x(使用ReLU激活和每层256个通道),并输出σ和256维特征向量。
这个特征向量随后与相机射线的观看方向连接,并传递给一个额外的全连接层,输出与视图相关的RGB颜色。
此外,NeRF还引入了两个改进来实现高分辨率复杂场景的表示。第一个是位置编码,以帮助MLP表示高频函数,第二个是分层抽样过程,使其能够有效地对高频表示进行抽样。
众所周知,Transformer架构中的位置编码可以提供序列中标记的离散位置,作为整个架构的输入。而NeRF使用位置编码是将连续的输入坐标映射到更高的维度空间,使MLP更容易逼近更高频率的函数。
从图中可以观察到,去除位置编码会大大降低模型表示高频几何和纹理的能力,最终导致外观过度平滑。
由于沿着每条相机射线在N个查询点密集评估神经辐射场网络的渲染策略十分低效,所以NeRF最后采用了一种分层表示,通过按最终渲染的预期效果比例分配样本来提高渲染效率。
简而言之,NeRF不再只使用一个网络来表示场景,而是同时优化两个网络,一个「粗粒度」网络和一个「细粒度」网络。
未来可期
NeRF解决了过去的不足,即使用MLP将对象和场景表示为连续函数。相比于过往的方法,NeRF可以产生更好的渲染效果。
但是,NeRF同样也面临许多技术瓶颈,比如NeRF的加速器会牺牲其他相对有用的功能(比如灵活性),以实现低延迟、更多交互环境以及较少训练时间的目的。
所以,NeRF虽是一个关键性的突破,但是想要达到完美的效果,还是需要一定的时间。
技术在进步,未来依旧可期!
以上是有望取代Deepfake?揭秘今年最火的NeRF技术有多牛的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

大家好,我卡颂。许多程序员朋友都希望参与自己的AI产品开发。我们可以根据"流程自动化程度"和"AI应用程度"将产品的形态划分为四个象限。其中:流程自动化程度衡量「产品的服务流程有多少需要人工介入」AI应用程度衡量「AI在产品中应用的比重」首先,限制AI的能力,以处理一张AI图片应用,用户在应用内通过与UI交互就能完成完整的服务流程,从而自动化程度高。同时,“AI图片处理”重度依赖AI的能力,所以AI应用程度高。第二象限,是常规的应用开发领域,比如开发个知识管理应用、时间管理应用、流程自动化程度高

若是将人工智能比喻为第四次工业革命的话,那么大模型便是第四次工业革命的粮食储备。在应用层面,它使工业界得以重温1956年美国达特茅斯会议的设想,并正式开启了重塑世界的序幕。根据大厂定义,AI家电是具备互联互通、人机交互和主动决策能力的家电,AI家电可以视作是智能家电的最高形态。然而,目前市面上AI加持的全屋智能模式是否能成为未来行业的主角?家电行业是否会诞生新竞争格局?本文将从三个方面来解析。全屋智能为何雷声大,雨点小?资料来源:Statista、中安网、艾瑞咨询、洛图科技、全国制锁行业信息中心

在2023年,生成式人工智能(ArtificialIntelligenceGeneratedContent,简称AIGC)成为科技领域最热门的话题,毫无疑问那么对于制造行业来说,他们应该怎样从生成式AI这项新兴技术中获益?广大正在实施数字化转型的中小企业,又可以由此获得怎样的启示?最近,亚马逊云科技与制造行业的代表一同合作,就中国制造业目前的发展趋势、传统制造业数字化转型所面临的挑战与机遇,以及生成式人工智能对制造业的创新重塑等话题进行了分享和深入探讨生成式AI在制造行业的应用现状提及中国制造业

IMAX中国AI艺术大片把影院搬到经典地标漓江时光网讯近日,IMAX打造中国首款AI艺术大片,在AI技术的助力下,IMAX影院“落地”包括长城、敦煌、桂林漓江、张掖丹霞在内的多个国内经典地标。此款AI艺术大片由IMAX联合数字艺术家@kefan404和尼欧数字创作,组画共四张,IMAX标志性的超大银幕或铺展于张掖丹霞缤纷绚丽的大自然“画布”之中,或于承载千年文化积淀的敦煌比邻矗立,或与桂林漓江的山水长卷融为一体,或在层峦叠嶂之中眺望巍峨长城,令人不禁期待想象成真的那一天。自2008年于日本东京巨

今年以来,360集团创始人周鸿祎在所有公开场合的讲话都离不开一个话题,那就是人工智能大模型。他曾自称“GPT的布道者”,对ChatGPT取得的突破赞不绝口,更是坚定看好由此产生的AI技术迭代。作为一个擅于表达的明星企业家,周鸿祎的演讲往往妙语连珠,所以他的“布道”也创造过很多热点话题,确实为AI大模型添了一把火。但对周鸿祎而言,光做意见领袖还不够,外界更关心他执掌的360公司如何应对这波AI新浪潮。事实上,在360内部,周鸿祎也早已掀起一场全员变革,4月份,他发出内部信,要求360每一位员工、每

华为常务董事余承东在今天的微博上发布了HDC大会邀请函,暗示鸿蒙或许将具备AI大模型能力。据他后续微博内容显示,邀请函文字是由智慧语音助手小艺生成的。余承东表示,鸿蒙世界即将带来更智能、更贴心的全新体验根据之前曝光的信息来看,今年鸿蒙4在AI能力方面有望取得重大进展,进一步巩固了AI作为鸿蒙系统的核心特性

从人工呼叫中心时代,经历了IVR流程设计、在线客服系统等的应用,到已经发展至如今的人工智能(AI)客服。作为服务客户的重要窗口,客服行业始终站在时代前端,不断利用新科技发展新生产力,向着高效率化、高品质化、高服务化以及个性化、全天候客户服务迈进。伴随着客户人群、数量的增多,以及人工服务成本的快速增加,如何利用人工智能、大数据等新一代信息科技,促进各行业的客户服务中心从劳动密集型向智能化、精细化、精细化的技术转型升级,已成为摆在诸多行业面前的重要问题。得益于人工智能技术不断进步与场景化应用的快速

在一个充满未来科技的世界中,人工智能已经成为人类生活中必不可少的助手。然而,人工智能不仅仅是为了方便我们的生活,它还以一种悄然存在的方式改变着人类社会的结构和运行。其中最重要的积极意义之一就是信息平等化消除数字鸿沟,让每个人都能平等享受科技带来的便利在当前数字化时代,信息化已经成为推动社会发展的重要力量。然而,我们也面临着一个现实问题,即存在着数字鸿沟,导致一部分人无法享受到科技所带来的便利。因此,信息化平权显得尤为重要,它能够消除数字鸿沟,让每个人都能平等分享科技发展的成果,实现社会的全面进步
