目录
数据问题
存储性能
GPU编排
首页 科技周边 人工智能 最大化利用GPU性能的方法

最大化利用GPU性能的方法

Aug 31, 2023 pm 05:09 PM
人工智能

加速人工智能项目的默认方法是增加GPU集群的规模。然而,由于GPU供应日益紧张,成本也越来越高。很多人工智能公司将超过80%的筹集资本用于计算资源,这是可以理解的。GPU是人工智能基础设施的关键,应该尽可能多地投入预算。然而,在这些高昂的成本之外,还有其他提高GPU性能的方法需要考虑,而且越来越迫切

最大化利用GPU性能的方法

扩展GPU集群并非易事,特别是在生成式人工智能暴力扩张导致GPU短缺的情况下。NVIDIA A100 GPU是受到影响的首批GPU之一,而且现在非常稀缺,一些版本的交付周期长达一年。这些供应链挑战迫使许多人考虑将更高端的H100作为替代品,但很明显会付出更高的价格。对于那些投资于自己基础设施、为其行业创造下一个伟大的生成式人工智能解决方案的创业者来说,需要从现有GPU中榨取每一滴效率

让我们来看看企业如何通过提议修改人工智能基础设施的网络和存储设计,从中获得更多的计算投资

数据问题

优化现有计算基础设施的利用率是一个重要的方法。为了最大化GPU利用率,需要解决数据传输速度过慢的问题,以确保GPU保持高负载运行。有些用户的GPU利用率仅为20%,这是不可接受的。因此,人工智能团队正在寻找最佳途径,以最大化人工智能投资的回报

GPU是人工智能的引擎。就像汽车发动机需要汽油才能运行一样,GPU也需要数据来进行运算。如果限制了数据流,就会限制GPU的性能。如果GPU的工作效率只有50%,那么人工智能团队的生产力就会下降,一个项目完成所需的时间会增加一倍,投资回报率也会减半。因此,在基础设施设计中,必须确保GPU能够以最高效率运行,并提供预期的计算性能

需要注意的是,DGX A100和H100服务器都有高达30 TB的内部存储容量。然而,考虑到平均模型大小约为150 TB,这个容量对于大多数深度学习模型来说是不够的。因此,需要额外的外部数据存储器来为GPU提供数据

存储性能

AI存储通常由服务器、NVMe SSD和存储软件组成,它们通常封装在一个简单的设备中。就像GPU被优化为与数以万计的核心并行处理大量数据一样,存储也需要具备高性能。在人工智能中,存储的基本要求是能够存储整个数据集,并以线速(即网络允许的最快速度)将数据传输到GPU,以保持GPU的高效运行和饱和。任何不足都会导致对这些非常昂贵和有价值的GPU资源的浪费

通过交付数据与能够跟上10或15台GPU服务器集群全速运行的速度,有助于优化GPU资源并提高整个环境的性能,同时尽可能充分利用预算,从整个基础设施中获得最大收益

事实上,挑战在于,没有针对AI进行优化的存储供应商需要许多客户端计算节点来从存储中提取全部性能。如果从一个GPU服务器开始,则反过来需要许多存储节点才能达到该性能才能为单个GPU服务器供应。

重写后的内容:不要轻信所有的基准结果;当使用多个GPU服务器时,可以轻松获得更大的带宽,但是人工智能依赖于存储,无论何时需要,它都会将所有性能提供给单个GPU节点。坚持使用能够提供所需超高性能的存储,但它可以在单个存储节点中实现这一点,并且能够将此性能提供给单个GPU节点。这可能会限制市场范围,但在开始人工智能项目之旅时,这是一个优先考虑的事项

网络带宽

越来越强大的计算能力推动了对其他人工智能基础设施的需求不断增加。带宽要求已经达到了新的高度,能够管理每秒从存储设备通过网络发送并由GPU处理的大量数据。存储设备中的网络适配器(NIC)连接到网络中的交换机,这些交换机连接到GPU服务器内部的适配器。NIC可以在正确配置的情况下将存储直接连接到1或2个GPU服务器中的NIC,不会出现瓶颈,确保带宽足够高,可以将最大数据负载从存储传递到GPU,使其在持续的时间内保持饱和,这是关键,在许多情况下,未能做到这一点是我们看到GPU利用率较低的原因。

GPU编排

一旦基础设施就位,GPU编排和分配工具将极大地帮助团队更高效地集结和分配资源,了解GPU的使用情况,提供更高级别的资源控制,减少瓶颈并提高利用率。只有在底层基础设施能够确保数据正确流动的情况下,这些工具才能如预期地完成所有这些任务

在人工智能领域,数据是输入的关键。因此,传统企业闪存在用于企业关键任务应用程序(如库存控制数据库服务器、电子邮件服务器、备份服务器)时,并不与人工智能相关。这些解决方案是使用传统协议构建的,尽管它们已被重新用于人工智能,但这些传统基础限制了它们在GPU和AI工作负载方面的性能,推高了价格,并浪费了资金在过于昂贵和不必要的功能上

在当前全球GPU短缺的情况下,再加上人工智能行业的迅猛发展,寻找最大限度提高GPU性能的方法变得前所未有的重要——尤其是在短期内。随着深度学习项目的蓬勃发展,这些方法成为降低成本和提高产出的几个关键途径

以上是最大化利用GPU性能的方法的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

使用Rag和Sem-Rag提供上下文增强AI编码助手 使用Rag和Sem-Rag提供上下文增强AI编码助手 Jun 10, 2024 am 11:08 AM

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 Jun 11, 2024 pm 03:57 PM

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

七个很酷的GenAI & LLM技术性面试问题 七个很酷的GenAI & LLM技术性面试问题 Jun 07, 2024 am 10:06 AM

想了解更多AIGC的内容,请访问:51CTOAI.x社区https://www.51cto.com/aigc/译者|晶颜审校|重楼不同于互联网上随处可见的传统问题库,这些问题需要跳出常规思维。大语言模型(LLM)在数据科学、生成式人工智能(GenAI)和人工智能领域越来越重要。这些复杂的算法提升了人类的技能,并在诸多行业中推动了效率和创新性的提升,成为企业保持竞争力的关键。LLM的应用范围非常广泛,它可以用于自然语言处理、文本生成、语音识别和推荐系统等领域。通过学习大量的数据,LLM能够生成文本

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 Jul 25, 2024 am 06:42 AM

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

你所不知道的机器学习五大学派 你所不知道的机器学习五大学派 Jun 05, 2024 pm 08:51 PM

机器学习是人工智能的重要分支,它赋予计算机从数据中学习的能力,并能够在无需明确编程的情况下改进自身能力。机器学习在各个领域都有着广泛的应用,从图像识别和自然语言处理到推荐系统和欺诈检测,它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论,其中最具影响力的五种方法被称为“机器学习五大派”。这五大派分别为符号派、联结派、进化派、贝叶斯派和类推学派。1.符号学派符号学(Symbolism),又称为符号主义,强调利用符号进行逻辑推理和表达知识。该学派认为学习是一种逆向演绎的过程,通过已有的

SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 Jul 17, 2024 pm 06:37 PM

编辑|KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「S

SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息,SK海力士今天(8月1日)发布博文,宣布将出席8月6日至8日,在美国加利福尼亚州圣克拉拉举行的全球半导体存储器峰会FMS2024,展示诸多新一代产品。未来存储器和存储峰会(FutureMemoryandStorage)简介前身是主要面向NAND供应商的闪存峰会(FlashMemorySummit),在人工智能技术日益受到关注的背景下,今年重新命名为未来存储器和存储峰会(FutureMemoryandStorage),以邀请DRAM和存储供应商等更多参与者。新产品SK海力士去年在

See all articles