首页 科技周边 人工智能 生成式AI的花园里 英伟达如何做'挖掘工”

生成式AI的花园里 英伟达如何做'挖掘工”

Jun 03, 2023 pm 06:08 PM

生成式AI的花园里 英伟达如何做“挖掘工”

英伟达的GPU为什么昂贵?

作者:江月

编辑:陶力 卢陶然

图源:图虫

"CPU扩张的时代已经过去了"是英伟达创始人兼CEO黄仁勋在5月29日台北国际电脑展上宣布的话。”整场持续了2小时的演讲中,他围绕着生成式AI带来的“触发点”,将英伟达近期的硬件、软件、系统新品进行了一番兜底式介绍。

黄仁勋称,GPU塑造的“新计算机”到来了。由英伟达打造的新型“计算机”,形态已经不同以往,它的单台售价高达20万美元。在“昂贵”的争议之中,黄仁勋又称,GPU是每个电力预算有限的公司之不二选择,也是最“省钱”的基建选择。

黄仁勋近期在公开演讲中称,面对AI时代,人们需要“奔跑、而不是慢慢地走”。在生成式AI的花园里,英伟达显然正在奋力挖掘中。

解码GPU数据中心成本

“大家总是说GPU数据中心很贵,让我来算给你看。”5月29日,英伟达创始人兼首席执行官黄仁勋在台北国际电脑展上,向公众具体地介绍了GPU数据中心的成本。

英伟达在与供应商和客户会面时带来了全新的AI计算机DGX GH200。这是一款集成了256个英伟达最高性能CPU和GPU的超级计算机,能满足“超大大模型”的训练需求。

DGX GH200使用英伟达NVLink-C2C互连技术,将基于Arm的Grace架构CPU和Hopper架构GPU进行架构互联,实现了高达900GB/s的总带宽,比传统加速系统中的标准PCIe Gen5通道高出7倍,这种算力能够满足眼下要求最苛刻的生成式AI和HPC应用。

生成式AI的花园里 英伟达如何做“挖掘工”

图为英伟达于5月29日公布的GH200 Grace Hopper超级芯片

英伟达公司供图

随着市场对数据中心基建需求的增长,英伟达眼下也需要向市场施展一些“销售手段”。最迫切的需求,就是化解人们对其设备“昂贵”的恐惧。

简单来说,“使用GPU数据中心,你可以获得150倍的性能,并省下2/3的成本。”黄仁勋称。

黄仁勋介绍,以同样的1000万美元预算为例,AIGC开发商可以搭建一个由960个CPU服务器组成的数据中心,这足以训练1个大语言模型,最终的运营消耗是11千兆瓦时电力(GWh,相当于1100万度电)。

但若换做GPU,则可搭建一个由48个GPU服务器组成的数据中心,不过这个数据中心可以训练44个大语言模型,总共消耗3.2千兆瓦时(相当于320万度电)。

按照上面的计算方法,按照单片价格计算,一片GPU芯片的价格是一片CPU的20倍,似乎“更贵”。不过,如果按照数据中心TCO成本计算法,则GPU数据中心更“省钱”。

黄仁勋甚至直接在演示PPT中列出了一个公式:数据中心持有成本=f{硬件成本(芯片、系统、硬件生态系统),吞吐量(GPU、AIgo软件、网络、系统软件、软件生态系统),使用率(AIgo Lib、软件生态系统),采购运营,生命周期最佳化,算力},从而解释了数据中心的TCO成本问题。

“为什么这非常重要?因为现实生活中大多数企业都有电力限制。”黄仁勋再次强调。在投入AIGC之时,考虑到这一客观因素,企业必须选择更为高效、低功耗的数据中心产品。

为何GPU在数据中心中的性能如此强大?黄仁勋介绍,这主要归功于三大功能:光线追踪(模拟光的特性)、以张量计算为核心的人工智能和全新的算法。

自 2017 年起,英伟达开始在 GPU 上同时实现这三个功能,并且其使用 GPU 生成图片的效果首次引起市场的惊艳。当时,使用CPU服务器“无中生有”一张图片需要花费数个小时(这个过程用专业说法叫做“渲染”),但英伟达使用GPU只花了15秒。

然而,新型GPU计算机所谓的“便宜”并不是针对消费级市场而言的。目前,个人电脑市场上的CPU为核心的PC、笔记本等因其价格更为实惠,无法被替代。

黄仁勋在演讲中展示了一台由8个H100芯片构成的全新GPU计算机。“它是全球最昂贵的计算机。”黄仁勋称。

这个新型电脑重达65磅(大约29.5公斤),必须要借助机器人才能实现平稳、精确的安装。“这台电脑售价20万美元。”黄仁勋称。

启动AIGC行业变革

这是一种重写方式:英伟达攻占AIGC龙头地位的第一步是通过使用硬件淘汰“CPU时代”。眼下,英伟达已经在软件生态圈中进行精心布局,除了将CUDA计算模型推广给400万名软件开发者以外,还推出了游戏AI模型代工服务,并深入到制造业中支持虚拟工厂、机器人仿真技术和自动化检测。

“为什么这么多年来,人们无法创造一种新的计算方法?”黄仁勋谈及CPU时代时称。他指出,这是因为硬件与软件、消费市场与开发商供应者之间存在一种“鸡生蛋、蛋生鸡”的关系,导致互相牵制,令基于CPU的计算方法得以持续甚久。

因此,为了打破“CPU时代”的桎梏,英伟达除了大力设计芯片硬件,也十分关注搭建软件生态环境。CUDA计算模型就是英伟达为这个长远布局落下的一枚关键棋子。

目前已有超过3000个应用程序和400万开发者使用英伟达Cuda计算模型。仅在去年一年,Cuda的下载量就达到了2500万次,总下载量已经达到了4000万次。”黄仁勋称。他指出,在拥有了如此庞大规模的软件基础上,GPU取代CPU才实现可能。

总结黄仁勋两个小时的演讲内容,可以看到英伟达对AIGC领域的挖掘,涵盖了核心的超级芯片、到互连技术再到算法引擎的优化、以及配套软件的升级。

事实上,AIGC所涉及到的文生文、文生图、2D图生3D图等,正在经过多种大模型或应用进行实现,包括英伟达旗下的对话式 AI 模型开源框架NeMo、Meta旗下的大模型LLaMa、使用GPT模型的应用ChatGPT、以及文生图应用Stable Diffusion等。

目前,全球最有影响力的AIGC科技龙头都在深度使用英伟达所提供的工具,也推动英伟达在美股市场上攀爬“1万亿美元”市值的高峰,很快就要和苹果、微软、谷歌、亚马逊一起处于“万亿俱乐部”中。

英伟达此次带给AIGC行业的工具之多,令市场感到十分吃惊。除了以上的产品,英伟达在大型游戏创作和数字化工厂方面的介入,也十分引人注目。

在游戏创作方面,黄仁勋展示了一段游戏片段。这个片段中,除了现实感逼真的画面制作外,游戏玩家和NPC之间的对话也是完全由AIGC生成的。换句话说,以后的游戏可以“千人千面”,玩家面对的不再是只会吐露模式化回复的NPC。ACE游戏开发版是英伟达提供的AI模型代工服务,它可以帮助游戏开发商轻松使用该功能。

英伟达又介绍,现在一些领先的电子制造商已经使用英伟达的AIGC和元宇宙平台omniverse实现工厂的“数字化”。

在制造业,全球大约有1000万家工厂,它们是工业数字化的重点领域。

黄仁勋表示:“工业制造的都是实物,如果能先以数字的方式制造产品,可以节省数十亿美元。”

眼下,在工业领域,英伟达主要打造了Omniverse和生成式AI来帮助工厂进行虚拟工厂的设计,还推出了Isaac Sim模拟和测试机器人、Metropolis光学检测自动化工具。

据了解,富士康、和硕、广达等电子设备制造商已经在利用英伟达上述工具加快笔记本电脑、智能手机的生产和装配。

21Tech

南财集团特色栏目

往期推荐

从工业互联网到AIGC:智能制造如何跃迁?

05-30

荣耀CEO赵明:按需制定芯片战略 2023年研发占比维持10%

05-30

手机厂商竞逐影像和折叠屏 华为详解技术密码

05-29

英伟达呼吁“以跑代走”做AI,发力超级计算、淘汰CPU时代

05-29

以上是生成式AI的花园里 英伟达如何做'挖掘工”的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

我尝试了使用光标AI编码的Vibe编码,这太神奇了! 我尝试了使用光标AI编码的Vibe编码,这太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测? 如何使用Yolo V12进行对象检测? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

最佳AI艺术生成器(免费付款)创意项目 最佳AI艺术生成器(免费付款)创意项目 Apr 02, 2025 pm 06:10 PM

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) 最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

如何将Mistral OCR用于下一个抹布模型 如何将Mistral OCR用于下一个抹布模型 Mar 21, 2025 am 11:11 AM

MISTRAL OCR:通过多模式文档理解彻底改变检索效果 检索增强的生成(RAG)系统具有明显高级的AI功能,从而可以访问大量的数据存储,以获得更明智的响应

顶级AI写作助理来增强您的内容创建 顶级AI写作助理来增强您的内容创建 Apr 02, 2025 pm 06:11 PM

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

See all articles