TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现
11 月 16 日消息,业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。
由 DALL-E 3 生成
根据报道,本站获悉,TPC 联盟由全球各实验室、科研机构、学术界和工业界的科学家组成,旨在共同推进用于科学发现的人工智能模型,并特别关注拥有一万亿或更多参数的巨型模型
TPC 联盟目前正致力于开发可扩展的模型架构和训练策略,同时组织和整理用于模型训练的科学数据,以优化 AI 库在当前和未来的百万兆次级计算平台上的应用
TPC 旨在创建一个开放的研究人员社区,为科学和工程问题开发大规模生成式 AI 模型,特别是,将启动联合项目,以避免重复工作并共享方法、途径、工具、知识和工作流程。通过这种方式,该联盟希望最大限度地发挥这些项目对更广泛的人工智能和科学界的影响。
TPC的目标是建立一个由资源、数据和专业知识组成的全球网络。自成立以来,该联盟已经成立了多个工作组,旨在解决构建大规模人工智能模型的复杂性
培训所需的百万兆次级计算资源将由美国能源部 (DOE) 的几个国家实验室以及日本、欧洲和其他国家 / 地区的几个 TPC 创始合作伙伴提供。即使有这些资源,培训也需要几个月的时间。
美国能源部阿贡国家实验室计算、环境和生命科学副主任、芝加哥大学计算机科学教授里克·史蒂文斯表示:“在我们的实验室和与世界各地的合作机构合作的过程中,我们的团队正在开始开发一系列用于科学研究的前沿人工智能模型,并准备使用大量此前未被开发的科学数据进行训练。”
以上是TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

MetaFAIR联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。据所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个GPU。以LLaMA270B模型为例,其训练总共需要1,720,320个GPU小时。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。最近,许多机构在训练SOTA生成式AI模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的PaLM模型训练过程中出现了多达20次的损失尖峰。数值偏差是造成这种训练不准确性的根因,

11月16日消息,业内领先的科研机构、美国国家超级计算中心和诸多AI领域龙头公司,近日联合组建了万亿参数联盟(TrillionParameterConsortium,简称TPC)。由DALL-E3生成根据报道,本站获悉,TPC联盟由全球各实验室、科研机构、学术界和工业界的科学家组成,旨在共同推进用于科学发现的人工智能模型,并特别关注拥有一万亿或更多参数的巨型模型TPC联盟目前正致力于开发可扩展的模型架构和训练策略,同时组织和整理用于模型训练的科学数据,以优化AI库在当前和未来的百万兆次级计算平台

11月15日消息,微软近日推出了名为“EverythingofThought”(XOT)的方法,灵感来自谷歌DeepMind的AlphaZero,利用紧凑的神经网络,来增强AI模型推理能力。微软和佐治亚理工学院、华东师范大学合作开发了该算法,整合了强化学习(reinforcementlearning)和蒙特卡洛树搜索(MCTS)能力,在复杂决策环境中,进一步提高解决问题的有效性。本站注意:微软研究团队表示,XOT方法可以使语言模型在不熟悉的问题上得到扩展,在Gameof24、8-Puzzle和P

6月26日消息,谷歌旗下DeepMind表示,该公司已经开发出一种名为RoboCat的人工智能模型,可以控制不同的机器人手臂执行一系列任务。仅仅这一点并不特别新颖,但DeepMind声称,该模型是第一个能够解决和适应多种任务的模型,并且使用不同的、真实世界的机器人来完成。RoboCat的灵感来自于DeepMind的另一个AI模型Gato,后者可以分析和处理文本、图像和事件。RoboCat的训练数据包括模拟和真实机器人的图像和动作数据,这些数据来自于虚拟环境中的其他机器人控制模型、人类控制的机器人

7月10日消息,Databricks日前发布大数据分析平台Spark所用的AI模型SDK,开发者写代码时,可用英文下指令,编译器就会将英文指令转换为PySpark或SQL语言代码,以提升开发者效率。▲图源Databricks网站据悉,Spark是一款开源大数据分析工具,每年超过10亿次下载、在全球208个国家和地区使用。▲图源Databricks网站Databricks表示,微软的AI代码助手GitHubCopilot固然强大,但使用门槛也相当高,Databricks的SDK相对更具普适性,更易

12月15日消息,谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。需要进行改写的内容是:▲图源:谷歌DeepMind(以下简称DeepMind)据悉,FunSearch模型训练法主要为AI模型引入了一个“评估器(Evaluator)”系统,AI模型输出一系列“创意解题方法”,“评估器”则负责评判模型输出的解题办法,反复迭代后,就能训练出数学能力更强的AI模型。谷歌的DeepM

微软于8月16日公布了其AI服务条款,并宣布该条款将于9月30日生效。这次更新的主要内容是针对生成式AI,特别是与相关用户的使用以及负责任的开发实践相关的内容微软强调官方不会保留用户与必应聊天的对话记录,也不会将这些聊天数据用于训练BingEnterpriseChat的AI模型这五个关键政策要点覆盖了多个领域,包括禁止用户试图对AI模型进行逆向工程以防止揭示底层组件;除非明确允许,否则禁止通过Web抓取等方式提取数据;一项重要条款限制用户使用AI数据来创建或增强其他AI服务以下是微软新增的条款内

6月14日消息,日前微软研究人员展示了LLaVA-Med模型,该模型主要用于生物医学方面的研究,可根据CT、X光图片等推测出患者的病理状况。据悉,微软研究人员与一批医院合作,获得了使用生物医学图像文本对应大型数据集来训练多模态AI模型。该数据集包括胸部X光、MRI、组织学、病理学和CT图像等,覆盖范围相对全面。▲图源微软微软使用GPT-4,基于VisionTransformer和Vicuna语言模型,在八个英伟达A100GPU上对LLaVA-Med进行训练,其中包含“每个图像的所有预分析信息”,
