人工智能 (AI) 及其能源需求继续为第四次工业革命提供动力。今天,任何人都可以使用先进的人工智能工具
人工智能(AI)及其能源需求继续为第四次工业革命提供动力。如今,任何人都可以访问先进的人工智能工具并将其集成到自己的系统中,以提高效率并减少工作量。随着人工智能应用需求的增加,驱动这些算法所需的能量也会增加。因此,环保主义者已经指出了围绕该技术的可持续性问题。值得庆幸的是,一组研究人员创造了一种高效的替代方案。这是你需要知道的。
不断增长的人工智能能源需求造成能源危机
新的人工智能系统不断以越来越高的频率推出。最新的全球能源使用预测预测,人工智能能源消耗将从 2022 年的 460 太瓦时 (TWh) 翻一番,到 2026 年达到 1,000 TWh。这些协议包括推荐器、大语言模型 (LLM)、图像和视频处理和创建、Web3服务等等。
根据研究人员的研究,人工智能系统需要的数据传输相当于“从片外主存储器读取三个 64 位源操作数和向片外主存储器写入一个 64 位目标操作数时计算所用能量的 200 倍”。因此,降低人工智能 (AI) 计算应用的能耗是开发人员最关心的问题,他们需要克服这一障碍以实现大规模采用并使技术成熟。
值得庆幸的是,明尼苏达大学的一群创新工程师已经提出了一种可能的解决方案,可以将人工智能协议的功耗降低几个数量级。为了完成这项任务,研究人员引入了一种新的芯片设计,该设计改进了当今大多数芯片中的冯诺依曼架构。冯诺依曼建筑
约翰·冯·诺依曼 (John von Neumann) 于 1945 年彻底改变了计算机领域,他将逻辑单元和内存单元分开,在当时实现了更高效的计算。在这种布置中,逻辑和数据存储在不同的物理位置。他的发明提高了性能,因为它允许同时访问两者。
今天,大多数计算机仍然使用冯·诺依曼结构,硬盘存储程序,随机存取存储器 (RAM) 存储编程指令和临时数据。今天的 RAM 使用各种方法来完成此任务,包括利用电容器的 DRAM 和具有多个电路的 SRAM。
值得注意的是,这种结构几十年来一直运行良好。然而,逻辑和内存之间不断传输数据需要大量能量。这种能量传递随着数据需求和计算负载的增加而增加。因此,它会造成性能瓶颈,随着计算能力的增加而限制效率。
尝试改善能源需求
多年来,人们进行了许多尝试来改进冯·诺依曼的架构。这些尝试创造了记忆过程的不同变化,目的是使这两个动作在物理上更加接近。目前,三个主要变体包括。
近内存处理
此升级使逻辑在物理上更接近内存。这是使用 3D 堆叠基础设施完成的。将逻辑移得更近可以减少传输计算所需数据所需的距离和能量。这种架构提高了效率。
内存计算
当前改进计算架构的另一种方法是内存计算。值得注意的是,这种类型的芯片有两种变体。最初的版本将逻辑集群集成在单个芯片上的内存旁边。这种部署可以消除前代产品中使用的晶体管。然而,很多人认为这种方法对于内存结构来说并不“真实”,因为它仍然具有单独的内存位置,这意味着数据传输导致的初始性能问题存在,尽管规模较小。
真正的内存
最终类型的芯片架构是“真正的内存中”。为了符合这种类型的架构,内存需要直接执行计算。这种结构增强了功能和性能,因为逻辑操作的数据保留在其位置。研究人员最新版本的真正内存架构是 CRAM。
(补习班)
计算随机存取存储器 (CRAM) 可实现真正的内存计算,因为数据是在同一数组中处理的。研究人员修改了标准 1T1M STT-MRAM 架构,使 CRAM 成为可能。 CRAM 布局将微型晶体管集成到每个单元中,并建立在基于磁隧道结的 CPU 之上。
这种方法提供了更好的控制和性能。然后,该团队在每个单元中堆叠了额外的晶体管、逻辑线 (LL) 和逻辑位线 (LBL),从而在同一存储体中实现实时计算。
CRAM 的历史
当今的人工智能系统需要一种新的结构来满足其计算需求,同时又不减少可持续性问题。认识到这一需求后,工程师决定首次深入研究 CRAM 功能。他们的研究结果发表在 NPJ 科学杂志上,题为“基于磁隧道结的计算随机存取存储器的实验演示”。
第一个 CRAM 利用了 MTJ 器件结构。这些自旋电子器件通过使用电子自旋而不是晶体管来传输和存储,从而改进了以前的存储方法
以上是CRAM:一种新的芯片设计,可以将人工智能协议的功耗降低几个数量级的详细内容。更多信息请关注PHP中文网其他相关文章!