高性能计算机又可称作“超级计算机”、“巨型计算机”,主要被用来解决其他计算机解决不了的挑战性问题,通常指具有极快运算速 度、极大存储容量、极高通信带宽的一类计算机。高性能计算机主要特点包含两个方面:极大的数据存储容量和极快速的数据处理速度,因此它可以在多种领域进行一些人们或者普通计算机无法进行的工作。
本教程操作环境:windows7系统、Dell G3电脑。
高性能计算机又可称作超级计算机、巨型计算机,是世界公认的高新技术制高点和21世纪最重要的科学领域之一。
高性能计算机(HPC,又称超级计算机)主要被用来解决其他计算机解决不了的挑战性问题,通常指具有极快运算速 度、极大存储容量、极高通信带宽的一类计算机。
主要特点包含两个方面:极大的数据存储容量和极快速的数据处理速度,因此它可以在多种领域进行一些人们或者普通计算机无法进行的工作。
高性能计算被视为计算机科学与工程的“皇冠”,各国近年来均频繁从国家层面启动研制计划。
高性能计算机(HPC,High Performance Computer,又称超级计算机)是国之重器。 从核爆炸模拟、油藏模拟,到极端天气预报等,高性能计算都守护着国家安全和安宁。 因此,高性能计算也成为衡量国家之间综合实力的基准之一,被视为国家实力的象征。 2020 年以来,十四五和新基建驱动我国高性能计算中心建设进入高速增长期,多地地方 政府和企事业单位都在积极建设和筹建高性能计算中心。
1.1. 高性能计算是什么?
高性能计算是指将多个计算节点组织起来,通过网络连接在一起,进行协同工作, 组成一台性能更强大的计算机,通常指具有极快运算速度、极大存储容量、极高通信带宽的一类计算机。高性能计算能够让整个计算机集群为同一个任务工作,以更快的速度来解决一个复杂问题。一台高性能计算上往往执行一个任务(或者有限的几个任务)。全部的计算机资源都被倾注到同一个任务中。为了解决同一个问题,集群的不同计算机之间要有非常好的沟通能力。
图1:高性能计算节点互联示意图
高性能计算机是计算机和网络的结合。假设说互联网从外部将分立的计算机连接在一起,那么集群则是将网络内部化,让网络成为系统内部不同计算机的沟通桥梁。首先创造性发明集群的是有“高性能计算之父”之称的 Seymour Cray。在 1960 年代,可以进行高性能运算的仅仅是经过特别设计的、昂贵的大型机。这些大型机需要复杂的回路以实现高运算频率,所以其设计和生产周期都非常长。
Seymour Cray 提出并行是提高计算机性能的有效方式。1964 年,Seymour Cray 研制的 CDC 6600 问世,他将多个普通的处理器连接起来,并使得这些处理器协同工作。政府和科研部门开始采购这样的新型的高性能计算机,以代替原有的大型机。高性能计算机为登月计划等大型科研项目做出了不可磨灭的贡献,开启了高性能计算技术和产业多年的持续发展与繁荣。
高性能计算近60 年的演变路线可简单地分为 2 个阶段:Cray 时代和多计算机时代。
(1)Cray 时代。从 20 世纪 60—90 年代初期的 30 年被称为“Cray 时代”,以单一内存向量机的技术革新为主导,Cray 定义和引领了前 30年的高性能计算市场。第一个 30 年研制以“顶天”为主,仅服务于国家战略部门。
(2)多计算机时代。从 20 世纪 90 年代迄今的后 30 年被称为“多计算机时代”,由于微处理器的出现,以及大量工业标准硬件的普及,以大规模互连多个通用乃至商用的计算部件的可扩展系统结构的技术创新主导了迄今为止的高性能计算发展。后 30年的高性能计算机在满足国家战略应用对性能巅峰需求的同时,“立地”成为发展的主要目标,市场驱动、高性能计算应用普及成为第二阶段的显著特点。
1.2. 高性能计算为什么重要?
高性能计算是计算机科学与工程的“皇冠”。高性能计算是计算机技术的源头之一。 互联网产业依赖的数据中心的核心技术,诸如 Hadoop等并行编程工具和 RDMA 等远程通信技术大多脱胎于此。因此,高性能计算机被视为计算机科学与工程的“皇冠”。各国均频繁从国家层面启动研制计划。在中国多次上榜全球高性能计算TOP500 后,美国自 2015 年起将多所中国高性能计算相关机构或企业列入实体清单,包括国防科大、无锡江南计算技术研究所、曙光、申威等。而我国高性能计算整体实力和美国相比仍然有较大 差距。
因此,发展自主可控的高性能计算至关重要。
高性能计算的核心能力是 64 位双精度浮点运算能力。高性能计算是一种通用算力, 其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强。业界广泛用于衡量 高性能计算性能的 Linpack 测试,测试的是高性能计算的“双精度浮点运算能力”,即 64 位浮点数字的计算(FP64),这是一种高精度的数值计算。在以二进制所表示数字精度 中,还有单精度(32 位,FP32)、半精度(16 位,FP16)以及整数类型(如 INT8、INT4) 等。数字位数越高,意味着人们可以在更大范围内的数值内体现两个数值的变化,从而 实现更精确计算。
高性能计算在底层芯片性能要求上高于普通的数据中心和智算中心。算力中心有多 种,大致可分为数据中心、高性能计算中心、智算中心等,而它们都可以用云的形式来 提供服务。以实现人工智能需求为例,推理、训练和模拟为AI 的三类主要任务。
在此维度上,芯片的应用上限由其底层构造所决定,即使采用软件优化也无法再提升。从芯片层面来看,如果底层芯片采用的是 CPU+专用 AI 芯片,那么其只能完成 AI 推理和训 练任务,而无法完成模拟。因为 AI 芯片无法实现双精度浮点运算,双精度浮点运算大 量涉及线性代数方程求解,而自然界的很多问题,包括科学问题、社会问题等,最后都 可转化为线性代数方程求解问题。
高性能计算的体系结构设计和软件同样重要。芯片是高性能计算的重要组成部分, 但不是高性能计算技术的全部。高性能计算不是简单的 CPU 堆砌,体系结构设计、高 速互联网络、并行文件系统、储存列阵等方面如果有所欠缺,即使堆再多的 CPU,高性 能计算性能也无法提高。随着计算能力的增强、应用课题规模和复杂度的增加,高性能 计算机对并行文件系统等性能要求越来越高。高性能计算的技术溢出效益非常明显。由 于服务器可以平滑地采用高性能计算的互联技术、CPU 技术、操作系统技术和并行软件 设计等技术,在高性能计算方面的积累能够自然地溢出到服务器产业。
3.1. 高性能计算主要应用于哪些场景?
高性能计算适用于需要并行运算的任务,应用场景持续拓展。高性能计算主要应用场景分为两类,一类是飞行器设计、核模拟实验、星云模拟、解密码等数值模拟场景, 一类是大数据分析、统计和人工智能等数据分析场景。
由于飞行器等工程设计中很多情 况无法实测,只能进行计算模拟,因此美国对出口高性能计算十分谨慎。高性能计算应用正在从过去的高精尖向更广更宽的方向发展。随着高性能计算的发展,尤其是使用成本的不断下降,其应用领域也从具有国家战略意义的核武器研制、信息安全、石油勘探等科学计算领域向更广泛的国民经济主战场快速扩张,比如制药、基因测序、动漫渲染、 数据挖掘、金融分析以及互联网服务等等。
从 2021 年 11 月中国高性能计算机 TOP100 中的行业应用领域 Linpack 性能份额来看,算力服务、高性能计算中心、人工智能、科学计算等领域是高性能计算的主要用户,互联网大数据特别是 AI 领域增长强劲。
图6:中国 TOP100 行业应用领域份额(2021.11)
3.2. 高性能计算的市场空间有多大?
十四五和新基建驱动高性能计算进入快速增长期。我国高性能计算中心建设主要通过部省(市)合作协议确立高性能计算中心的建设计划,国家科技部代表国家科技战略对主机性能设定目标。地方政府希望高性能计算中心能成为区域科技发展的功能载体, 为其聚集人才、创新科技并推动经济发展。2021 年 3 月,我国“十四五规划”中明确提出,要“加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群,建设 E 级和 10E 级超级计算中心。”根据规划,合肥、兰 州、厦门、太原等地多地都将陆续建立高性能计算中心。
“东数西算”工程落地有望进一步促进西部地区发展高性能计算中心。2022 年 2 月,国家发改委批复同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。至此, 全国一体化大数据中心体系完成总体布局设计,代表着“东数西算”工程正式全面启动。 西部有风力发电、光伏发电,能源丰富,而且年平均气温比较低,十分适合计算中心的生存,而高性能计算业务对实时通讯的需求不高,未来高性能计算中心有望成为优化算力布局的重要载体。
我们预计大型高性能计算中心单个投入在 20 亿元以上,按平均每年新建 5 个高性能计算中心计算,政府规划的高性能计算中心市场规模每年将达到 100 亿元。
2022 年中国整体高性能计算市场规模将超 400 亿元。除政府规划外,阿里、腾讯等 多家互联网巨头均积极布局高性能计算建设。以腾讯为例,其于 2020 年 6 月正式开工 的长三角人工智能高性能计算中心投资超 450 亿元,建成后将承担各种大规模 AI 算法 计算、机器学习、图像处理、科学计算和工程计算任务。此外,金融机构、运营商等均 在积极部署自己的高性能计算。根据观研天下预测,2022 年中国高性能计算行业总体市 场规模将超 400 亿元,2021-2025 年 CAGR 为 13%左右。
联想、曙光、浪潮市占率分列前三。从中国高性能计算 TOP100 中主要公司系统个数统计来看,2002 年之前,TOP100 主要是国外的 HP、IBM 为主,后期以中国的联想、 曙光和浪潮为主。
中科曙光在 1998 年完成 863 项目“曙光 2000”可扩展机群体系结构的超级服务器,2001 年完成“曙光 3000”超级服务器后,从 2005 年开始,市场竞争开始有突出表现,曙光 2010-2019 年连续 10 年按装机台数市场份额第一,2019 年占到接 近 40%。
浪潮在 2012 年完成“863 计划”容错服务器项目后,2014 年开始有明显起色。
联想公司通过 2014 年对 IBM 公司 X86 HPC 产品线的并购,市场份额异军突起,到 2021年已实现 TOP100 装机台数份额第一。
而联想、浪潮、曙光中,只有曙光拥有从芯片等 硬件到软件系统的国产自主知识产权。
更多相关知识,请访问常见问题栏目!
以上是高性能计算机又可称作什么的详细内容。更多信息请关注PHP中文网其他相关文章!