美国重夺全球超算第一!人类实现百亿亿次E级超算,Frontier屠榜全球Top500
已经霸榜两年,完成四连冠的日本富岳终于跌落了「神坛」。
在刚刚公布的2022年全球超算Top500名单中,美国橡树岭国家实验室(ORNL)的Frontier夺得第一。 凭借1.102 Exaflop/s的HPL分数,Frontier不仅是有史以来最强大的超级计算机,它也是第一台真正的「E级超算」。
相比之下,中国的神威·太湖之光和天河二号排名下滑至第六和第九。 去年,美国将神威·太湖之光的处理器供应商申威列入了实体清单,或多或少给中国超算的发展造成了影响。
这次Top500的64位浮点计算总算力为4.4 exaflops,比六个月前的上一期榜单增长了44.7%。
Frontier:突破百亿亿次
那么,Frontier的性能到底达到了怎样「逆天」的程度呢?! 简单来说,就是把排在它之后的468个超算的算力加起来,都比不过一个Frontier。
除了如此炫目的算力之外,Frontier还是全球跑AI最快的超级电脑之一。在HPL-AI基准的混合精度性能测试中,Frontier跑出了6.88 ExaFlops的成绩。
用白话说,这个性能相当于,给一个860亿神经元组成的智能体中的每个神经元,每秒都下达6800万个指令。 用这个训练AI大模型,那可真是火箭发动机搭上了一级方程式赛车,可以直接在赛道上起飞。 全新的Frontier占地372平方米,由74个HPE Cray EX机柜组成,可容纳9408个节点。
其中,每个节点有一个AMD Milan 「Trento」 7A53 Epyc CPU,搭配512GB DDR4内存和4个AMD Radeon Instinct MI250X GPU。 总的来说,该系统有602,112个CPU核心,与4.6PB的DDR4内存相连接。 此外,37,888个AMD MI250X GPU具有8,138,240个核心,并搭配了4.6PB的HBM内存(每个GPU有128GB)。 CPU和GPU使用基于以太网的HPE Cray Slingshot-11网络结构进行连接。
储存上则与一个性能极佳的存储子系统相连,有着700PB的容量,75TB/s的吞吐量和150亿IOPS的性能。 元数据层分布在480个NVMe SSD上,提供10PB的整体容量,而5400个NVMe SSD为主要的高速存储层提供11.5PB的容量。 同时,47,700个PMR硬盘提供679PB的容量。
散热方面,基于水冷的系统让6000加仑的水在350马力的泵在整个系统中「移动」,由此将温度控制在了85度左右。 直观来说,这些水泵可以在30分钟内填满一个奥林匹克标准游泳池。 Frontier不仅是现在世界上最快的超算,也是最环保的超算。
Frontier的能耗比,亦居全球超算的环保程度Green500榜单之首。单个由第三代AMD的Epyc处理器与Instinct MI250x加速器组建的机柜单元,其能耗效率是每瓦电能运算62.68 gigaflops。
不过,想把Frontier组装起来可不容易,ORNL必须采购685个不同编号的6000万个部件。 此外,在建造过程中还不得不去应对芯片的短缺。
ORNL受影响的零件编号有167个,算下来是200万个零件。而AMD缺少MI200 GPU的15个编号的零件。
于是ORNL与ASCR合作,为这些零件获得了国防优先权和分配系统(DPAS)评级,这意味着美国政府可以使用年度的防务预算,用显著高于市场价的更优厚价格来采购这些部件。 很快,「短缺」的问题也就得到了解决。
经过这波操作,是不是可以解开很多人心中所谓的「疑惑」了呢? 美国:为了我们的国防事业,加大力度搞超算!
虽然这么花钱,但用处不可谓不广。在英伟达老黄这种财主老爷都要做地球数字孪生体的时代,各国官方部门的超级计算机在开发处理庞大数据的AI、模拟气候和产业用途等方面越来越重要。 就算橡树林自己用不完这算力,也可以租、售嘛,工业界对算力可是嗷嗷待哺。
而且这已有他国先例:在预测机床材料加工结果的实验中,日本DMG森精机床自带工业电脑需要8小时,但富岳只需要10分钟就完成了。
中国:玩你们的,我就看看
在新一期榜单上,中国和美国仍然是上榜最多的国家。
在上榜超算数量上,中国仍为173台,和上期持平,继续位列榜首。美国从上期的150台下降到127台,排名次席。尽管如此,这两个国家仍然占了TOP 500榜单总数的60%。 日本、德国、法国分别以34、31、22台位列3-5位。
虽然此次Frontier正式成为世界上最强大的超级计算机,但它还没有与去年被曝光的两个中国超算进行比较。 不过,这两个系统目前都没有向Top500提交测试数据。
根据爆料的数据,有不少外媒推断Sunway OceanLight(神威·海洋之光)超级计算机在HPL基准上的峰值约为1.3 exaflops/1.05 exaflops,而天河三号则能够达到1.7 exaflops峰值/1.3 exaflops持续值。然而,考虑到美国在芯片上的各种「卡脖子」,中国超算刷榜的后果很有可能就变成了一个制裁的「靶子」,想必短时间内应该不会看到任何有关数据的更新了。
上榜数量占比上,中国以34.6%的比例占据榜首,美国以25.4%的比例位列第二,中美争霸的态势依旧。
而在总性能排行榜上,美国的优势仍然不可动摇,以47.3%的总算力牢牢占据首位,不难看出,此次登顶的Frontier为美国稳定霸榜贡献不小。
此外,此次Top 500榜单还统计了自1990年起超算算力的进步趋势,并进行了线性回归。 表中横轴为时间,纵轴为算力(取对数)。
绿色点为上榜超算的总算力,黄色三角为榜单冠军的算力,蓝色方块为榜单倒数第一(第500名)超算的算力。对应颜色的直线为线性回归的结果。 可以看到,这三条直线大致符合摩尔定律的对算力提升的预测性判断。 都说摩尔定律已死,看起来在超算领域,它还活的很好很健壮。
欧洲崛起:Top10占据7席
美国并不是唯一取得显著成绩的地区。欧洲也表现良好,从总排名上看,美、中、日占据前3,前十中剩余的七席则全部为欧洲国家占据。
其中德国上榜31台,法国上榜22台,意大利上榜14台。 芬兰新部署的LUMI超级计算机以151.9 petaflops的FP64性能勉强超过美国的Summit,获得第3名。
另外,法国GENCI-CINES的Adastra以46.1 petaflops的性能险些夺得第10名。虽然远不及LUMI强大,但Adastra仍然保持着欧洲第二强大的超级计算机的殊荣。 LUMI和Adastra等系统也说明了另一个趋势。与Frontier一样,它们基于HPE的全AMD Cray EX平台,使用第三代Epyc CPU和Instinct GPU。
为啥不用GPU加速:还是差钱
长久以来,AMD第一次在Top500中的系统内的主机CPU中占有代表性的份额,但英特尔至强处理器仍然占主导地位。
从本世纪初开始,英特尔在高性能计算领域开始发力,只用了几年时间,就将IBM、惠普等几家之前的主要玩家排挤得元气大伤。 从2017年到2020年,英特尔在高性能计算领域达到极盛的市场占有率一度超过90%。
直到目前,英特尔的份额仍高达77.4%,下降了4.2个百分点,而AMD的份额正好上升了这个数字。预计Epycs会在与Xeon SP的竞争中获得更大的动力。而且,AMD有后来居上的势头。在2022年的全球超算Top500榜单中,现在有94台超算依赖AMD的产品,年度增长95%。而且AMD的 Instinct MI200 加速器首次被其中7台超算采用。
另一个问题是,为什么不用GPU加速器?可能是因为贵? GPU加速器作为计算引擎,可以提升巨大的性能和性价比,但目前,加速器并没有在Top500榜单上的超算架构中占据主导地
位。这些GPU加速器主要是英伟达的。 但是,除了英伟达自家的HPC中心有大量应用需要移植到GPU上,而且不差钱之外,世界上成千上万的其他HPC中心还是差钱的,这些HPC的代码是明确为CPU编写的。
目前的Top500榜单中,只有170台超算采用了GPU加速器--当然大部分来自英伟达。 另一个因素是,更便宜的CPU本身现在也在陆续添加类似于GPU的加速计算功能,比如向量和现在的矩阵计算等。
这样就比将CPU程序转移至GPU运行更省钱,也更容易编程。我们可能永远不会看到一个主要由GPU加速系统组成的Top500榜单了。 事实上,在「富岳」、「太湖之光」这样排名靠前的超算系统中,CPU基本上充当了具备向量和矩阵计算型GPU的作用。
以上是美国重夺全球超算第一!人类实现百亿亿次E级超算,Frontier屠榜全球Top500的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本站1月30日消息,意大利能源巨头Eni埃尼集团近日宣布将建设全新的HPC6超级计算机。该超算将基于AMDEPYCCPU和InstinctMI250XGPU打造,完成后理论峰值算力将达600PFlop/s,持续峰值算力也将有400PFlop/s,可在现有Top500榜单中排到第五。经查询得知,埃尼集团是世界传统大型石油公司之一,同时也是意大利最大的三家企业之一。据了解,该公司由意大利政府持股约30%。▲上一代HPC5超算照片。图源埃尼集团官网埃尼集团现有2座超算进入了Top500超算榜单:之前的

随着互联网的快速发展,网站所面对的用户数量也在不断增长。对于大型的网站来说,如何实现热门排行功能是一个非常重要的问题。热门排行可以让用户方便地查看当前最受欢迎的内容,同时也可以为网站的推广和流量增长带来很大的帮助。本文将介绍如何使用PHP实现热门排行功能。确定热门排行的指标在实现热门排行功能之前,我们需要先确定热门排行的指标。指标可以是点击次数、浏览量、收藏

前段时间,来自LMSYSOrg(UC伯克利主导)的研究人员搞了个大新闻——大语言模型版排位赛!这次,团队不仅带来了4位新玩家,而且还有一个(准)中文排行榜。OpenAIGPT-4OpenAIGPT-3.5-turboAnthropicClaude-v1RWKV-4-Raven-14B(开源)毫无疑问,只要GPT-4参战,必定是稳居第一。不过,出乎意料的是,Claude不仅超过了把OpenAI带上神坛的GPT-3.5位列第二,而且只比GPT-4差了50分。相比之下,排名第三的GPT-3.5只比13

又是一年高考季。记得当年小编高考的时候,还流行这么一句话。那就是,「本科看学校,读研看专业」。这话放之前可能确实没什么错。然而,随着近几年科技突飞猛进的发展,一些和前端科技挂钩的专业可能就要从本科开始起步了。要说当下最火的专业,莫过于人工智能了。恰好最近AIRankings发布了一份全球大学AI相关专业排行榜。让我们一起看看有哪些大学和机构榜上有名吧。AI世界排名:北清综合前三AIRankings排名综合过去十年的研究,以及通用人工智能、计算机视觉、机器人、机器学习、自然语言处理、认知推理、多智

amd图形显卡排行1、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6950XT2、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6900XT需要重写的是:3、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6800XT4、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6800需要重写的是:5、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6750XT6、Radeon需要重新写作的内容是:RX需要重新写作的内容是:6700XT7

本站6月26日消息,全球最强超级计算机所配备的超强GPU数量不到5万片,而AMD公司为了增强和英伟达的竞争力,目标推出支持120万片GPU的超级数据中心AI集群。在接受TheNextPlatform采访时,AMD数据中心解决方案集团执行副总裁兼总经理Forrest Norrod表示,公司正在认真考虑构建最大规模的人工智能GPU集群。本站注:人工智能训练集群通常由数千片GPU构建,通过高速互连连接服务器机架,而AMD正研究的120万片无疑在数量级上指数倍增长,这必然带来延迟、功耗、硬件故障等多方面

酷狗音乐是一款拥有海量音乐的播放软件,酷狗音乐中每天都会有用户在这里面听歌,无论是在坐车、游玩、办公等等都会带着耳机来听歌,听歌都是有时长的,也会非常详细的记录下来,就有小伙伴想要知道自己听歌的时间有多久了码吧呢这个要怎么去看呢?想要知道的小伙伴让我们一起到本站本站中翻阅准备好的攻略,内存非常详细,一起来看看吧。酷狗音乐查看听歌排行榜的方法 1、进入到酷狗音乐软件中,点击右下角的【我的】选项; 2、然后在我的页面中点击打开自己的【头像】; 3、接着进入到个人主页的页面中点击【听歌排行】

本站4月25日消息,英伟达公司近日宣布和日本产业技术综合研究所(AIST)合作,搭建名为“ABCI-Q”的超级计算机,将整合传统超级计算机和量子计算机打造出混合云系统。由于英伟达表达单独运行量子计算器仍然会犯很多错误,因此超级计算机必须帮助解决错误,让复杂的运算变得更加顺畅。ABCI-Q+%执行高速、复杂计算的能力将有助于人工智能、能源和生物技术领域的研究和企业应用,例如提高新药开发和物流的效率率。该网站从报道中获悉,ABCI-Q+内置超过2000片英伟达H100TensorCoreGPU,并通
