- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
- 为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐LLM方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管RLHF方法的结果很出色,但其中涉及到了一些优化难题。其中涉及到训练一个奖励模型,然后优化一个策略模型来最大化该奖励。近段时间已有一些研究者探索了更简单的离线算法,其中之一便是直接偏好优化(DPO)。DPO是通过参数化RLHF中的奖励函数来直接根据偏好数据学习策略模型,这样就无需显示式的奖励模型了。该方法简单稳定
- 人工智能 417 2024-06-01 16:41:36
-
- ControlNet作者新作爆火:P照片换背景不求人,AI打光完美融入
- ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1.2k。用于操纵图像照明效果的IC-Light,全称lmposingConsistentLight。玩法很简单:上传意味着系统会自动分离人物等主体,并选择光源位置,填上提示词,就能毫无破绽地融入新环境了!赶紧来个王家卫式的打光:不喜欢?没关系,换成窗外打进来的自然光,也就分分钟的事。目前,IC-Light提供两类模型:文本条件重照明模型,还有背景条件模型。两种模型都需要以前景图像作为输入。鉴于之前Controlnet太好玩儿,这次IC
- 人工智能 1080 2024-06-01 16:23:10
-
- 可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
- 编辑|X几十年来,核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在,在普林斯顿等离子体物理实验室(PPPL)中,科学家正借助人工智能,来解决人类面临的紧迫挑战:通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同,机器学习不仅仅是指令列表,它可以分析数据、推断特征之间的关系,并从新知识中学习和适应。PPPL+研究人员相信,这种学习和适应能力可以通过多种方式改善他们对聚变反应的控制。这包括完善超热等离子体周围容器的设计、优化加热方法以及在越来越长的时间内保持反应的稳定控制。近
- 人工智能 674 2024-06-01 15:57:53
-
- 掌阅科技携手亚马逊云科技,以生成式 AI 之力重塑阅读体验
- 在数字化时代,尽管信息获取变得轻而易举,但读者在享受阅读的过程中仍面临诸多挑战。从挑选书籍的迷茫,到阅读过程中的注意力分散,再到阅读后的知识吸收与整理,构成了读者体验中的一道道难关。作为深耕数字阅读领域的领军企业,掌阅科技深刻洞察用户在阅读方面的不同需求,探索运用生成式AI技术重塑阅读体验。借助亚马逊云科技的相关技术,丰富文生图、文生视频等多元化阅读场景,为用户打造数字化与沉浸式创新阅读体验。触达阅读本质核心,重塑阅读体验孙凯指出,从过去阅读市场发展趋势来看,我们看到随着技术和设备的不断升级迭代
- 人工智能 720 2024-06-01 15:02:07
-
- 李飞飞揭秘创业方向'空间智能”:视觉化为洞察,看见成为理解,理解导致行动
- 斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察;看见成为理解;理解导致行动。在李飞飞15分钟TED演讲完整公开的基础上,从数亿年前生命进化的起源开始,到人类如何不满足于自然赋予而发展人工智能,直到下一步如何构建空间智能。9年前,李飞飞在同一个舞台上,向世界介绍了刚诞生不久的ImageNet——这一轮深度学习爆发的起点之一。她本人也向网友自我安利:如果把两个视频都看了,你就能对过去10年的计算机视
- 人工智能 964 2024-06-01 14:55:34
-
- 腾讯混元升级模型矩阵,云上推出256k长文模型
- 大模型落地加速,“产业实用”成为发展共识。2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业
- 人工智能 525 2024-06-01 13:46:36
-
- 携手亚马逊云科技,北京灵奥科技助力企业无缝结合大模型与数据
- 随着生成式AI时代不断发展,越来越多的企业开始关注、应用甚至训练大模型,想要以此创造更大的业务价值。这一想法固然没错,大模型的出现必能为企业带来创新和突破。不过,基础模型依赖于大规模高质量数据集,想要借助生成式AI带来企业差异化优势的关键是企业的专有数据,数据是企业核心竞争力之一。近日,亚马逊云科技以“无数据不模型——生成式AI时代的数据基座”为主题召开了媒体沟通会。会上,北京灵奥科技CEO厉启鹏介绍了Vanus如何帮助企业解决数据问题,从而与大模型无缝结合。北京灵奥科技是一家快速成长的初创企业
- 人工智能 1074 2024-06-01 12:48:21
-
- 克雷研究所100万美元奖金要归AI了数学界规则大改,未来数学家如何应对「海量猜想」
- 在数学的世界里,想要对“一个未经证实的猜想”进行完整的证明,往往需要天赋、直觉和经验的结合,即使是数学家也很难解释自己的发现过程。然而,随着近几年大模型的崛起,我们共同见证了一种新的变革力量,AI不仅在预测椭圆曲线的复杂度上超越了人类,还在探索基本常数的新公式上取得了突破。最近,伦敦数学科学研究所所长托马斯·芬克(ThomasFink)在Nature的worldview栏目发表了一篇文章,探讨了AI如何在数学领域中发挥其独特的作用,以及如何帮助数学家从猜想走向证明。在这篇文章中,芬克提到了AI在
- 人工智能 403 2024-06-01 11:02:46
-
- 一文带您了解SHAP:机器学习的模型解释
- 在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(ExplainableAI|XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任和信心。提高模型的透明度可以通过多种复杂模型的广泛应用等方法来实现,以及用于解释模型的决策过程。这些方法包括特征重要性分析、模型预测区间估计、局部可解释性算法等。特征重要性分析可以通过评估模型对输入特征的影响程度来解释模型的决策过程。模型预测区间估计
- 人工智能 642 2024-06-01 10:58:13
-
- 亮相CCIG2024,合合信息文档解析技术破解大模型语料'饥荒”难题
- 2024年,中国图象图形大会在古都西安盛大开幕。本届大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,通过二十多场论坛、百余项成果,集中展示了生产式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司(简称“合合信恒”)联合主办了《大模型技术及其前沿应用》论坛,来自华南理工大学、上海交通大学、清华大学、复旦大学、上海人工智能实
- 人工智能 740 2024-05-31 22:28:49
-
- 腾讯云AI代码助手全面对外开放
- 5月22日,腾讯云正式对外宣布旗下AI代码助手全面对外开放,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。腾讯云AI代码助手是一款定位代码智能补全和生成的数字化工具,它基于腾讯混元代码模型,可以为开发者、开发团队及企业客户提供安全合规、高粘度体验的编码场景AIGC服务,具备代理代码补全、技术对话、代码诊断、单元测试等功能,支持Python、Java、C/C++、Go等十种编程语言或框架,并集成主流集成开发环境。在代码补全方面,AI代码助手可基于多文件理解、根据上下文提供良好的自动补全
- 人工智能 903 2024-05-31 20:08:24
-
- Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
- MetaFAIR联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。据所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个GPU。以LLaMA270B模型为例,其训练总共需要1,720,320个GPU小时。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。最近,许多机构在训练SOTA生成式AI模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的PaLM模型训练过程中出现了多达20次的损失尖峰。数值偏差是造成这种训练不准确性的根因,
- 人工智能 614 2024-05-30 13:24:53
-
- 一文带您了解数据模型:概念模型、逻辑模型和物理模型
- 数据模型是组织数据管理的基石,是构建信息基础设施的关键组成部分。数据模型为组织提供了清晰的数据结构和逻辑框架,使得数据管理更加高效和可持续。在数字化时代,数据已成为企业最宝贵的资产之一,而数据模型的设计和实施,则决定了数据在企业运营和决策中的有效性和可信度。良好的数据模型不仅能够够简化复杂的数据景观,提高数据质量和一致性,还能够够优化数据库性能,支持数据分析和决策制定。因此,数据模型的意义在于为企业提供了数据驱动的决策支持,促进了业务的创新和竞争力的提升。在为企业提供了数据驱动的决策支持,促进了
- 人工智能 723 2024-05-30 12:00:35
-
- 图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
- 这几天,AI届的盛会——ICLR在维也纳举办。OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。毫无意外地,ICLR2024展厅也变成了追星现场。热闹的气氛,快把屋顶掀翻了。现场追星图灵巨头图灵三巨头中的著名「e人」LeCun,提前就在X上大方公布出自己的行程,满怀期待地等着和粉丝们相见了。在评论区,不仅有粉丝激动打卡,甚至还有准备现场递简历的。粉丝们果然不虚此行,在现场,LeCun口若悬河地讲解,热情的观
- 人工智能 552 2024-05-30 11:17:17
-
- 多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级
- 编辑|白菜叶许多临床任务需要了解专业数据,例如医学图像、基因组学等。这类专业知识信息在通用多模态大模型的训练中通常不存...在上一篇论文的描述中,Med-Gemini在各种医学成像任务上超越GPT-4系列模型实现了SOTA!在这里,GoogleDeepMind撰写了第二篇关于Med-Gemini的论文。在Gemini的多模态模型的基础上,该团队为Med-Gemini系列开发了多个模型。这些模型继承了Gemini的核心功能,并通过2D和3D放射学、组织病理学、眼科、皮肤病学和基因组数据的微调,针对
- 人工智能 1115 2024-05-30 10:13:19