目录
以DPU为中心的数据中心网络架构
首页 科技周边 人工智能 云计算通用可编程DPU发展

云计算通用可编程DPU发展

Apr 07, 2023 pm 07:31 PM
云计算

着眼于数据中心的技术发展和演进,DPU 作为通用的数据处理器,它不是对 NIC/SmartNIC 的简单替代,而是对网络基础架构的本质改变。DPU 本身所具有的通用层级化可编程性、低时延网络、统一管控的特性使得 DPU 正在促进新一代数据中心从架构上实现优化和重构。DPU 作为通用数据处理的基础部件,将卸载原本运行在CPU、GPU中的通用数据处理任务,释放CPU、GPU 的算力,支撑 CPU、GPU 发挥更大的效能。

云计算通用可编程DPU发展

云计算通用可编程DPU发展白皮书(2023年)”白皮书通过阐明和分析 DPU 发展的过程与现状,指出哪些 DPU 特性是解决上述核心问题的关键点,从而推动 DPU 技术的深入发展,助力实现完整的生态链建设和产业落地。

关于DPU技术应用及技术原理,请参看文章“DPU技术原理、算力效率及应用场景解析”和“主流DPU架构实现及技术对比”、“DPU性能基准:测评框架与测试流程介绍(2022)”以及“DPU全球格局,国内5家崛起(2023)”。

重点分析了DPU需具备的通用可编程特性和各种应用场景,同时分析了传统DPU的局限性。近些年,由于业界没有优异和成熟的商用DPU SoC (System on a chip)方案,各大云厂商只能各自研发基于CPU+FPGA的DPU方案,导致DPU被误解为是个碎片化的市场,DPU对云计算的作用及潜力没有被业界正确认识。

在“十四五”规划明确指出加快推进新型基础设施建设后,东数西算工程和运营商算力网络建设如约而至。数字经济的背后,云计算是最核心的算力底座。在云计算里面,DPU已成为基础设施最核心的部件之一。

数字经济时代,云计算不断进入各行各业。中国移动作为云计算“国家队”,正在加大投入,全力支持政府与国有企业数字化转型,降本增效,并为国有数据安全保驾护航。在该白皮书中,云豹智能作为中国移动唯一邀约参编企业,是国内DPU芯片头部企业,也是国内已知真正能做到高性能通用可编程DPU SoC的芯片公司。该白皮书的联合发布,代表着中国移动和云豹智能在DPU领域的深度合作,强强联手,为国家云基础架构及DPU的发展贡献力量。

以DPU为中心的数据中心网络架构

传统数据中心随着网络带宽逐步从25Gbps向100Gbps、200Gbps、400Gbps乃至更高的带宽演进,网络数据处理占用的CPU算力资源也在不断地增大,甚至会有一半以上会消耗在这些基础设施的功能上,因此迫切需要一种新型处理器来减少对云主机CPU的消耗。DPU是以数据处理为中心,提供数据中心基础设施服务的通用处理器,是继CPU、GPU之后的“第三颗主力芯片”,可以卸载及加速网络和存储,同时具备安全和管控等基础功能,释放更多的算力资源供客户使用。在云计算与数据中心场景下,如果需要进一步提升算力与发挥基础设施效能,譬如动态和弹性地调度算力、网络和存储资源,那么DPU是必须的,且是不可替代的。

目前,国内云厂商大部分还是基于CPU+FPGA的DPU解决方案,这些方案在研发投入上拥有一定的时间优势,但因其功耗过高及性能受到限制,并未达到新一代云计算的要求。另外,由于FPGA基本被国外两大芯片巨头垄断,其高昂的价格也直接导致了产品成本居高不下,影响市场竞争力。

DPU SoC的产品是前者迭代的终极形态,需具备超高的异构芯片技术,通用可编程等特性,连同先进的芯片工艺,才能够满足更复杂、更广泛、更高性能的应用需求。目前,国外芯片巨头和头部云服务商都选择了通用DPU SoC的产品路线,因为相对于CPU+FPGA的方案,DPU SoC 有4到8倍性价比的提升。

各云厂商都在寻找最佳方案来提升各自的利润和竞争力,因为了解到CPU+FPGA并不是一个长远能满足新一代云计算的方案,所以都在期待一款有竞争力、易用及高性价比的DPU SoC出现。

美国的亚马逊云(AWS)不仅占据全球云计算市场最高份额,而且多年前已最先实现了DPU SoC(AWS称之为Nitro)商业化的成功部署。AWS在使用自研的DPU SoC后,每年售卖每台服务器的算力资源可以多获得几千美元的收益。AWS拥有几百万台服务器的体量,因此DPU带来AWS的收益是巨大的。DPU在AWS中的成功应用,受到业内广泛关注,并吸引了越来越多的芯片巨头涌入DPU赛道。Nvidia于2020年以69亿美元成功收购了业内知名网络芯片和设备公司Mellanox,通过融合Mellanox的网络技术,快速面向全球数据中心市场推出BlueField系列的DPU SoC。AMD于2022年以19亿美元收购了DPU SoC厂商Pensando。而国内的云厂商也正在寻求从FPGA架构到通用可编程DPU SoC演变的技术方案。

正是在这样的背景下,中国移动联合信通院和云豹智能发布了《云计算通用可编程DPU发展白皮书(2023年)》。深度解析了DPU的发展趋势:通用可编程、低时延网络、统一资源管理。同时介绍了通用可编程DPU SoC在数据中心、运营商、异构计算等多种不同的应用场景。

国内的数据中心建设中,服务器正在从25G向100G及更高带宽发展,并且应用部署的复杂度持续增高,不但要支持虚拟机、容器的应用管理部署,也需要支持裸金属应用。DPU作为数据中心的核心基础设施部件,要具备灵活的编程能力、数据的高吞吐能力和统一管控的能力,才能满足当前各种云计算业务和数据中心发展的需求。

根据半导体行业观察的了解,目前云豹智能是国内已知真正能做到自研高性能DPU SoC的芯片公司,其产品也将是国内第一款通用可编程DPU SoC芯片。不仅提供高达400G的数据吞吐能力,还搭载性能强劲的CPU处理单元并配合多种可编程的数据处理引擎实现层级化可编程能力。根据该白皮书的描述,云豹智能在DPU的多个关键领域掌握并引领着多项核心技术:

  • 可编程高性能网络处理技术
  • 可编程低时延RDMA技术
  • DDP(Data Direct Path)数据直通技术
  • 安全计算体系

云豹智能DPU SoC支持裸金属、虚拟机和容器统一运维和管控,提供弹性网络和存储、虚拟化管理和安全等一站式解决方案,极大地提升云服务商的服务质量和业务灵活性,降低整体投入,引领数据中心向算网融合持续演进。

中国移动作为支持国家数字经济的主要云服务商,在这白皮书给出了明确的答案,DPU SoC是云计算的关键部件,通用可编程的DPU SoC可以实现对数据中心的算力、网络和存储资源的经济高效卸载和管理。也明确分析了DPU SoC需具备的关键特性:层级化可编程性、低时延网络,统一管控以及适应持续发展的加速卸载,是云厂商推动数据中心向高效率、高扩展、高带宽、高灵活性发展的重要技术支撑。同时,也是各云厂商正在积极研究及探寻的DPU技术的发展方向。

以上是云计算通用可编程DPU发展的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
威尔R.E.P.O.有交叉游戏吗?
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

云计算巨头掀起法律战:亚马逊状告诺基亚专利侵权 云计算巨头掀起法律战:亚马逊状告诺基亚专利侵权 Jul 31, 2024 pm 12:47 PM

本站7月31日消息,科技巨头亚马逊于周二在美国特拉华州联邦法院起诉了芬兰电信公司诺基亚,指控其侵犯了亚马逊十几项与云计算技术相关的专利。1.亚马逊在诉讼中表示,诺基亚滥用了亚马逊云计算服务(AWS)的相关技术,包括云计算基础设施、安全和性能方面的技术,来加强其自身的云服务产品。诉状称,亚马逊于2006年推出了AWS,其开创性的云计算技术早在2000年代初期就开始研发。“亚马逊是云计算领域的先驱,现在诺基亚却在未经许可的情况下使用亚马逊的专利云计算创新成果,”诉状中写道。亚马逊要求法院发布禁令,阻

C++云计算最佳实践:部署、管理和伸缩性考虑因素 C++云计算最佳实践:部署、管理和伸缩性考虑因素 Jun 01, 2024 pm 05:51 PM

为了实现C++云应用程序的有效部署,最佳实践包括:容器化部署,使用Docker等容器。采用CI/CD,自动化发布过程。使用版本控制,管理代码更改。实施日志记录和监控,跟踪应用程序运行状况。使用自动扩展,优化资源利用率。利用云管理服务,管理应用程序基础设施。采用水平伸缩和垂直伸缩,根据需求调整应用程序容量。

Golang 技术在云计算领域中的应用替代方案 Golang 技术在云计算领域中的应用替代方案 May 09, 2024 pm 03:36 PM

Golang云计算替代方案包括:Node.js(轻量级、事件驱动)、Python(易用、数据科学能力)、Java(稳定、高性能)和Rust(安全、并发)。选择最合适的替代方案取决于应用程序需求、生态系统、团队技能和可扩展性。

随着人工智能时代需求的增长,AWS、微软、谷歌继续投资云计算 随着人工智能时代需求的增长,AWS、微软、谷歌继续投资云计算 May 06, 2024 pm 04:22 PM

到2024年为止,三大云计算巨头的增长没有任何放缓迹象,亚马逊、微软和谷歌在云计算领域的收入都比往任何时候都多。这三家云供应商最近公布了财报,它们均延续了多年的持续收入增长策略。4月25日,谷歌和微软均公布了业绩。Alphabet2024财年第一季度,谷歌云收入为95.7亿美元,同比增长28%。微软的云收入为351亿美元,同比增长23%。4月30日,亚马逊网络服务(AWS)报告称其营收为250亿美元,同比增长17%,位列三大巨头之列。云计算提供商有很多值得高兴的事情,三大市场领导者的增长率在过去

Java云计算:云迁移策略和步骤 Java云计算:云迁移策略和步骤 Jun 05, 2024 pm 03:54 PM

Java云迁移涉及将应用程序和数据迁移到云平台,以获得扩展、弹性和成本优化等好处。最佳实践包括:全面评估迁移资格和潜在挑战。分阶段迁移以降低风险。采用云优先原则,尽可能构建云原生应用程序。使用容器化简化迁移和提高可移植性。利用自动化简化迁移过程。云迁移步骤涵盖规划和评估、准备目标环境、迁移应用程序、迁移数据、测试和验证,以及优化和监控。通过遵循这些实践,Java开发人员可以成功地迁移到云平台,从而获得云计算的好处,通过自动化和分阶段迁移,可降低风险,确保成功迁移。

PHP REST API与云计算平台的整合 PHP REST API与云计算平台的整合 Jun 04, 2024 pm 03:52 PM

PHPRESTAPI与云计算平台的整合优势:可扩展性、可靠性、弹性。步骤:1.创建GCP项目和服务账号。2.安装GoogleAPIPHP库。3.初始化GCP客户端库。4.开发RESTAPI端点。最佳实践:使用缓存、处理错误、限制请求速率、使用HTTPS。实战案例:上传文件到GoogleCloudStorageusingCloudStorage客户端库。

Golang 技术在云计算领域中的应用是否需要高昂成本 Golang 技术在云计算领域中的应用是否需要高昂成本 May 09, 2024 pm 02:00 PM

Golang在云计算中具有经济适用性,因为它直接编译为原生代码,运行时轻量级,且具有出色的并发性。这些因素可以降低云计算资源需求、提高性能和简化管理,从而降低成本。

Java云计算:高可用性和容错策略指南 Java云计算:高可用性和容错策略指南 Jun 01, 2024 pm 01:00 PM

本文提供Java云计算应用程序的高可用性和容错策略指南,包括以下策略:高可用性策略:负载均衡自动伸缩冗余部署多区域持久性故障转移容错策略:重试机制电路中断幂等操作超时和回退错误处理实战案例演示了这些策略在不同场景中的应用,例如负载均衡和自动伸缩以应对高峰流量,冗余部署和故障转移以提高可靠性,以及重试机制和幂等操作以防止数据丢失。

See all articles