- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本
- 我们知道LLM是在大规模计算机集群上使用海量数据训练得到的,本站曾介绍过不少用于辅助和改进LLM训练流程的方法和技术。而今天,我们要分享的是一篇深入技术底层的文章,介绍如何将一堆连操作系统也没有的「裸机」变成用于训练LLM的计算机集群。这篇文章来自于AI初创公司Imbue,该公司致力于通过理解机器的思维方式来实现通用智能。当然,将一堆连操作系统也没有的「裸机」变成用于训练LLM的计算机集群并不是一个轻松的过程,充满了探索和试错,但Imbue最终成功训练了一个700亿参数的LLM,并在此过程中积累
- 人工智能 782 2024-07-24 20:13:31
-
- 击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
- 经历了提前两天的「意外泄露」之后,Llama3.1终于在昨夜由官方正式发布了。Llama3.1将上下文长度扩展到了128K,拥有8B、70B和405B三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对AI社区来说,Llama3.1405B最重要的意义是刷新了开源基础模型的能力上限,Meta官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下表展示了当前Llama3系列模型在关键基准测试上的性能。可以看出,405B模型的性能与GPT-4o十分接近。与此同时,Meta公布了《TheLlam
- 人工智能 1085 2024-07-24 18:42:03
-
- 性能强11倍,佐治亚理工、清华团队用AI辅助发现储能新材料,登Nature子刊
- 编辑|萝卜皮静电电容器是国防、航空、能源和交通领域先进电力系统中的关键储能元件。能量密度是静电电容器的品质因数,主要由介电材料的选择决定。大多数工业级聚合物介电材料都是柔性聚烯烃或刚性芳族化合物,具有高能量密度或高热稳定性,但不能同时具有这两种特性。在这里,佐治亚理工学院(GeorgiaInstituteofTechnology)、康涅狄格大学(UniversityofConnecticut)以及清华大学的研究团队利用人工智能(AI)、聚合物化学和分子工程,来发现聚降冰片烯和聚酰亚胺系列中的一系
- 人工智能 446 2024-07-24 17:42:52
-
- 神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊
- 这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。计算生物学助理教授、HeritageMedical研究所研究员MattThomson说:「有一种感觉是,即使是最先进
- 人工智能 699 2024-07-24 09:38:12
-
- 首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
- 快准备好你的GPU!Llama3.1终于现身了,不过出处却不是Meta官方。今日,Reddit上新版Llama大模型泄露的消息遭到了疯传,除了基础模型,还包括8B、70B和最大参数的405B的基准测试结果。下图为Llama3.1各版本与OpenAIGPT-4o、Llama38B/70B的比较结果。可以看到,即使是70B的版本,也在多项基准上超过了GPT-4o。图源:https://x.com/mattshumer_/status/1815444612414087294显然,3.1版本的8B和70
- 人工智能 1295 2024-07-23 20:51:33
-
- ECCV 2024|盲视频去闪烁通用方法BlazeBVD来了,美图&国科大联合提出
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用
- 人工智能 438 2024-07-23 15:13:34
-
- 小米投资的具身智能机器人公司和焊接巨头官宣战略合作
- 近期,小米集团投资的首个具身智能企业“小雨智造”,与行业巨头松下的合资公司唐山松下达成重大战略合作,旨在共同开发先进的大模型智能焊接机器人。 7月18日,唐山松下产业机器人有限公司(下称“唐山松下”)与北京小雨智造科技有限公司(下称“小雨智造”)的战略合作签约仪式在唐山松下总部圆满完成。松下产业机器有限公司总经理桥山佑一郎、执行副总经理柳铮,小雨智造创始人兼CEO乔忠良、联合创始人兼副总裁李川等领导共同出席了签约仪式,双方均对本次合作寄
- 人工智能 475 2024-07-23 14:50:54
-
- 无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散
- 当前,采用下一token预测范式的自回归大型语言模型已经风靡全球,同时互联网上的大量合成图像和视频也早已让我们见识到了扩散模型的强大之处。近日,MITCSAIL的一个研究团队(一作为MIT在读博士陈博远)成功地将全序列扩散模型与下一token模型的强大能力统合到了一起,提出了一种训练和采样范式:DiffusionForcing(DF)。论文标题:DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion论文地址:https:/
- 人工智能 1164 2024-07-23 14:05:21
-
- 继'阿里星”后,阿里淘天重启顶尖技术人才招聘,百万年薪是标配
- 7月22日,阿里巴巴淘天集团的“顶尖人才T-Star计划“正式启动。该项目延揽全球前沿技术领域的竞赛、学术和实战高手,为这些“天才少年”提供顶尖技术课题、算力资源、研发平台资源,和百万年薪起步、“大牛主管”专属培养的顶配成长空间。记者了解到,T-Star计划是“阿里星”计划的延续,“阿里星”起源于2011年,吸引最年轻最顶级的技术人才加入是它的宗旨。过往招聘进来的大多是博士,获得副总裁级
- 人工智能 900 2024-07-22 21:20:23
-
- ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com吴翼,清华大学交叉信息院助理教授,曾任OpenAI全职研究员,研究领域为强化学习,大模型对齐,人机交互,机器人学习等。2019年在美国加州大学伯克利分校获得博士学位,师从Stu
- 人工智能 402 2024-07-22 18:41:23
-
- AI成像新标准,仅1%原始数据可达最佳性能,通用医学基础模型登Nature子刊
- 编辑|白菜叶经过大规模预训练的基础模型已在非医学领域取得了巨大成功。然而,训练这些模型通常需要大量全面的数据集,这与生物医学成像中常见的较小且更专业的数据集形成鲜明对比。德国弗劳恩霍夫数字医学研究所(FraunhoferInstituteforDigitalMedicineMEVIS)的研究人员提出了一种多任务学习策略,将训练任务数量与内存需求分离开来。他们在多任务数据库(包括断层扫描、显微镜和X射线图像)上训练了一个通用生物医学预训练模型(UMedPT),并采用了各种标记策略,例如分类、分割和
- 人工智能 1061 2024-07-22 17:38:00
-
- ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者来自浙江大学、上海人工智能实验室、香港中文大学、悉尼大学和牛津大学。作者列表:吴逸璇,王逸舟,唐诗翔,吴文灏,贺通,WanliOuyang,PhilipTorr,Jia
- 人工智能 605 2024-07-22 17:28:30
-
- KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的主要作者来自香港大学的数据智能实验室(DataIntelligenceLab)。作者中,第一作者任旭滨和第二作者汤嘉斌都是香港大学数据科学院的一年级博士生,指导老师为Da
- 人工智能 1194 2024-07-22 16:54:34
-
- 中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本工作由中科大认知智能全国重点实验室IEEEFellow陈恩红团队与华为诺亚方舟实验室完成。陈恩红教授团队深耕数据挖掘、机器学习领域,在顶级期刊与会议上发表多篇论文,谷歌学术论
- 人工智能 837 2024-07-22 16:39:35
-
- 权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了
- 小模型成趋势?本周,OpenAI上线小模型GPT-4o-mini,小模型赛道正式开卷。近期加入这一赛道的还有苹果。最近,苹果公司作为DataComp-LM(DCLM)项目的研究机构之一,在HuggingFace上发布了DCLM-7B开源模型。该模型性能已经超越了Mistral-7B,并且正在逼近其他领先的开源模型,包括Llama3和Gemma。论文链接:https://arxiv.org/pdf/2406.11794项目链接:https://huggingface.co/apple/DCLM-7
- 人工智能 515 2024-07-22 16:18:40