- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 一文读懂 Arthur Bench LLM 评估框架
- Hellofolks,我是Luga,今天我们来聊一下人工智能(AI)生态领域相关的技术-LLM评估。众所周知,LLM评估是人工智能领域的一个重要议题。随着LLM在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴的LLM评估工具,ArthurBench旨在为AI研究人员和开发人员提供一个全面、公正和可重复的评估平台。一、传统文本评估面临的挑战近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一
- 人工智能 400 2024-06-01 17:57:01
-
- 科大讯飞联手支付宝,共建智能座舱服务生态
- 30天,科大讯飞与支付宝宣布签约,双方将在大模型、车机支付、小程序服务等领域展开合作,共建更为智能的座舱服务生态。今后,将有更多支付宝小程序服务能够通过科大讯飞上车机,为车主提供贯穿行前、行中、行后的多场景智能、便捷用车体验。随着互联网流量渗透进入全景化进程,小程序已经成为品牌展开经营的重要阵地,我们希望通过支付宝小程序生态为车主提供更丰富的服务。讯飞汽车事业部副总经理和卫民表示,科大讯飞将发挥多端互联技术、小程序安全等系统技术优势,将支付宝平台的智能车联网服务生态输送到品牌车机端。根据权威研究
- 人工智能 325 2024-06-01 17:55:26
-
- 手撕Llama3第1层: 从零开始实现llama3
- 一、Llama3的架构在本系列文章中,我们从头开始实现llama3。Llama3的整体架构:图片Llama3的模型参数:让我们来看看这些参数在LlaMa3模型中的实际数值。图片[1]上下文窗口(context-window)在实例化LlaMa类时,变量max_seq_len定义了context-window。类中还有其他参数,但这个参数与transformer模型的关系最为直接。这里的max_seq_len是8K。图片[2]词汇量(Vocabulary-size)和注意力层(AttentionL
- 人工智能 974 2024-06-01 17:45:42
-
- 简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024
- 论文链接:https://arxiv.org/pdf/2405.08768代码和预训练模型已开源:https://github.com/LeapLabTHU/EfficientTrain会议版本论文(ICCV2023):https://arxiv.org/pdf/2211.09703计算机视觉研究院专栏ColumnofComputerVisionInstitute本文主要介绍刚刚被IEEETransactionsonPatternAnalysisandMachineIntelligence(TP
- 人工智能 368 2024-06-01 17:41:29
-
- 全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
- 为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐LLM方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管RLHF方法的结果很出色,但其中涉及到了一些优化难题。其中涉及到训练一个奖励模型,然后优化一个策略模型来最大化该奖励。近段时间已有一些研究者探索了更简单的离线算法,其中之一便是直接偏好优化(DPO)。DPO是通过参数化RLHF中的奖励函数来直接根据偏好数据学习策略模型,这样就无需显示式的奖励模型了。该方法简单稳定
- 人工智能 520 2024-06-01 16:41:36
-
- ControlNet作者新作爆火:P照片换背景不求人,AI打光完美融入
- ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1.2k。用于操纵图像照明效果的IC-Light,全称lmposingConsistentLight。玩法很简单:上传意味着系统会自动分离人物等主体,并选择光源位置,填上提示词,就能毫无破绽地融入新环境了!赶紧来个王家卫式的打光:不喜欢?没关系,换成窗外打进来的自然光,也就分分钟的事。目前,IC-Light提供两类模型:文本条件重照明模型,还有背景条件模型。两种模型都需要以前景图像作为输入。鉴于之前Controlnet太好玩儿,这次IC
- 人工智能 1137 2024-06-01 16:23:10
-
- 可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
- 编辑|X几十年来,核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在,在普林斯顿等离子体物理实验室(PPPL)中,科学家正借助人工智能,来解决人类面临的紧迫挑战:通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同,机器学习不仅仅是指令列表,它可以分析数据、推断特征之间的关系,并从新知识中学习和适应。PPPL+研究人员相信,这种学习和适应能力可以通过多种方式改善他们对聚变反应的控制。这包括完善超热等离子体周围容器的设计、优化加热方法以及在越来越长的时间内保持反应的稳定控制。近
- 人工智能 724 2024-06-01 15:57:53
-
- 掌阅科技携手亚马逊云科技,以生成式 AI 之力重塑阅读体验
- 在数字化时代,尽管信息获取变得轻而易举,但读者在享受阅读的过程中仍面临诸多挑战。从挑选书籍的迷茫,到阅读过程中的注意力分散,再到阅读后的知识吸收与整理,构成了读者体验中的一道道难关。作为深耕数字阅读领域的领军企业,掌阅科技深刻洞察用户在阅读方面的不同需求,探索运用生成式AI技术重塑阅读体验。借助亚马逊云科技的相关技术,丰富文生图、文生视频等多元化阅读场景,为用户打造数字化与沉浸式创新阅读体验。触达阅读本质核心,重塑阅读体验孙凯指出,从过去阅读市场发展趋势来看,我们看到随着技术和设备的不断升级迭代
- 人工智能 773 2024-06-01 15:02:07
-
- 李飞飞揭秘创业方向'空间智能”:视觉化为洞察,看见成为理解,理解导致行动
- 斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察;看见成为理解;理解导致行动。在李飞飞15分钟TED演讲完整公开的基础上,从数亿年前生命进化的起源开始,到人类如何不满足于自然赋予而发展人工智能,直到下一步如何构建空间智能。9年前,李飞飞在同一个舞台上,向世界介绍了刚诞生不久的ImageNet——这一轮深度学习爆发的起点之一。她本人也向网友自我安利:如果把两个视频都看了,你就能对过去10年的计算机视
- 人工智能 1050 2024-06-01 14:55:34
-
- 腾讯混元升级模型矩阵,云上推出256k长文模型
- 大模型落地加速,“产业实用”成为发展共识。2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业
- 人工智能 604 2024-06-01 13:46:36
-
- 携手亚马逊云科技,北京灵奥科技助力企业无缝结合大模型与数据
- 随着生成式AI时代不断发展,越来越多的企业开始关注、应用甚至训练大模型,想要以此创造更大的业务价值。这一想法固然没错,大模型的出现必能为企业带来创新和突破。不过,基础模型依赖于大规模高质量数据集,想要借助生成式AI带来企业差异化优势的关键是企业的专有数据,数据是企业核心竞争力之一。近日,亚马逊云科技以“无数据不模型——生成式AI时代的数据基座”为主题召开了媒体沟通会。会上,北京灵奥科技CEO厉启鹏介绍了Vanus如何帮助企业解决数据问题,从而与大模型无缝结合。北京灵奥科技是一家快速成长的初创企业
- 人工智能 1119 2024-06-01 12:48:21
-
- 克雷研究所100万美元奖金要归AI了数学界规则大改,未来数学家如何应对「海量猜想」
- 在数学的世界里,想要对“一个未经证实的猜想”进行完整的证明,往往需要天赋、直觉和经验的结合,即使是数学家也很难解释自己的发现过程。然而,随着近几年大模型的崛起,我们共同见证了一种新的变革力量,AI不仅在预测椭圆曲线的复杂度上超越了人类,还在探索基本常数的新公式上取得了突破。最近,伦敦数学科学研究所所长托马斯·芬克(ThomasFink)在Nature的worldview栏目发表了一篇文章,探讨了AI如何在数学领域中发挥其独特的作用,以及如何帮助数学家从猜想走向证明。在这篇文章中,芬克提到了AI在
- 人工智能 453 2024-06-01 11:02:46
-
- 一文带您了解SHAP:机器学习的模型解释
- 在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(ExplainableAI|XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任和信心。提高模型的透明度可以通过多种复杂模型的广泛应用等方法来实现,以及用于解释模型的决策过程。这些方法包括特征重要性分析、模型预测区间估计、局部可解释性算法等。特征重要性分析可以通过评估模型对输入特征的影响程度来解释模型的决策过程。模型预测区间估计
- 人工智能 738 2024-06-01 10:58:13
-
- 亮相CCIG2024,合合信息文档解析技术破解大模型语料'饥荒”难题
- 2024年,中国图象图形大会在古都西安盛大开幕。本届大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,通过二十多场论坛、百余项成果,集中展示了生产式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司(简称“合合信恒”)联合主办了《大模型技术及其前沿应用》论坛,来自华南理工大学、上海交通大学、清华大学、复旦大学、上海人工智能实
- 人工智能 790 2024-05-31 22:28:49
-
- 腾讯云AI代码助手全面对外开放
- 5月22日,腾讯云正式对外宣布旗下AI代码助手全面对外开放,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。腾讯云AI代码助手是一款定位代码智能补全和生成的数字化工具,它基于腾讯混元代码模型,可以为开发者、开发团队及企业客户提供安全合规、高粘度体验的编码场景AIGC服务,具备代理代码补全、技术对话、代码诊断、单元测试等功能,支持Python、Java、C/C++、Go等十种编程语言或框架,并集成主流集成开发环境。在代码补全方面,AI代码助手可基于多文件理解、根据上下文提供良好的自动补全
- 人工智能 942 2024-05-31 20:08:24