- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RL
- 人工智能 869 2024-06-24 15:04:43
-
- 为什么都放弃了LangChain?
- 或许从诞生那天起,LangChain就注定是一个口碑两极分化的产品。看好LangChain的人欣赏它丰富的工具和组建和易于集成等特点,不看好LangChain的人,认为它注定失败——在这个技术变化如此之快的年代,用LangChain来构建一切根本行不通。夸张点的还有:「在我的咨询工作中,我花了70%的精力来说服人们不要使用langchain或llamaindex。这解决了他们90%的问题。」最近,一篇LangChain吐槽文再次成为热议焦点:作者FabianBoth是AI测试工具O
- 人工智能 1212 2024-06-24 14:20:32
-
- ICML 2024 | 特征污染:神经网络会学习不相关特征而泛化失败
- 论文标题:FeatureContamination:NeuralNetworksLearnUncorrelatedFeaturesandFailtoGeneralize论文链接:https://arxiv.org/pdf/2406.03345代码链接:https://github.com/trzhang0116/feature-contamination随着以GPT为代表的大模型在近年来取得的巨大成功,深度神经网络+SGD+scaling的机器学习范式再次证明了其在AI领域的主导地位。为什么基于
- 人工智能 931 2024-06-24 14:17:11
-
- CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为SergeBelongie。他硕士毕业于苏黎世联邦理工学院(ETHZurich),在硕士期间,他在导师LucVan
- 人工智能 920 2024-06-24 14:05:51
-
- 字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在生成式模型的迅速发展中,ImageTokenization扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Toke
- 人工智能 1255 2024-06-24 14:03:31
-
- 华为云用盘古大模型重塑服务,ModelArts Studio全面升级
- 华为开发者大会2024在东莞召开。在大会现场,华为发布了HarmonyOSNext、盘古大模型5.0等方面的最新进展,并介绍了一系列AI先进技术的应用案例。华为云CTO张宇昕表示:“华为云基于盘古大模型的能力,重塑一系列的云服务,打造AINative的云,助力千行万业智能化。”据介绍,华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全
- 人工智能 454 2024-06-22 11:55:38
-
- 一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
- 机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude3.5能力真那么玄乎?它来了,它来了,它带着Claude3.5Sonnet走来了!蛰伏三个月,就在昨晚,OpenAI的「劲敌」Anthropic上新了,推出新一代模型——Claude3.5Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解
- 人工智能 1172 2024-06-22 07:46:19
-
- 涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型
- 作者|香港中文大学白帆编辑|ScienceAI近日,香港中文大学和智源联合提出的M3D系列工作,包括M3D-Data,M3D-LaMed和M3D-Bench,从数据集、模型和测评全方面推动3D医学图像分析的发展。(1)M3D-Data是目前最大的3D医学图像数据集,包括M3D-Cap(120K3D图文对),M3D-VQA(510K问答对),M3D-Seg(150K3DMask),M3D-RefSeg(3K推理分割)共四个子数据集。(2)M3D-LaMed是目前最多功能的3D医学多模态大模型,能够
- 人工智能 813 2024-06-22 07:16:49
-
- 无论真实还是AI视频,「摩斯卡」都能重建恢复4D动态可渲染场景
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com雷嘉晖,美国宾夕法尼亚大学计算机系博士生(2020-今),导师为KostasDaniilidis教授,目前主要研究方向为四维动态场景几何的建模表示和算法以及应用。他在计算机视觉
- 人工智能 807 2024-06-22 07:09:52
-
- 自动识别最佳分子,降低合成成本,MIT开发分子设计决策算法框架
- 编辑|紫罗AI在简化药物发现方面的应用正在爆炸式增长。从数十亿种候选分子中筛选出可能具有开发新药所需特性的分子。需要考虑的变量太多了,从材料价格到出错的风险,即使科学家使用AI,权衡合成最佳候选分子的成本也不是一件容易的事。在此,MIT研究人员开发了一个定量决策算法框架SPARROW,来自动识别最佳分子候选物,从而最大限度地降低合成成本,同时最大限度地提高候选物具有所需特性的可能性。该算法还确定了合成这些分子所需的材料和实验步骤。SPARROW考虑了一次合成一批分子的成本,因为多个候选分子通常可
- 人工智能 1239 2024-06-22 06:43:34
-
- WAIC论坛报名|齐聚多家央国企与AI公司,共议产业融通发展
- 作为新质生产力的引擎,人工智能正快速与千行百业融合。3月5日,国务院总理李强在政府工作报告中介绍今年政府工作任务时提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。自此,人工智能赋能产业发展的战略加速落地。为进一步助力“人工智能+”的进程,展现、分享成功探索者的经验,助力人工智能领域供需双方展开合作,由本站主办、人工智能场景化应用与智能系统测评工业和信息化部重点实验室协办的「2024WAIC人工智能赋能产业融通发
- 人工智能 1255 2024-06-22 04:59:29
-
- 小冰联合视美泰共创ShiMeta数字人解决方案:大模型加持,让每一个大屏终端都成为全新的交互载体
- 2024年6月21日,小冰公司与AIoT头部企业视美泰宣布达成战略合作,共同推出ShiMeta数字人解决方案。双方联合打造多种形态的数字人智能交互大屏终端,将小冰AI大模型、数字人技术与视美泰丰富的硬件商业生态相融合,让数字人走入各类行业场景,为千行百业注入全新的生产力,提升用户体验和服务效率,带来更多智能化变革。小冰×视美泰:丰富的硬件商业生态方案将小冰大模型以及神经网络渲染、超级自然语音等先进数字人技术,与视美泰高性能主板、高清摄像头、麦克风阵列、设备管理平台等进行了深入整合,实现大屏终端
- 人工智能 678 2024-06-22 02:22:30
-
- 不做数值运算、纯靠嘴炮也能机器学习?基于自然语言的全新ML范式来了
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生,RobertBamler是图宾根大学机器学习方向的教授,BernhardSchölkopf是马克思普朗克-
- 人工智能 500 2024-06-22 02:06:40
-
- 力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用
- 如今,大模型领域更卷了!前脚OpenAI发布GPT4o,硬控全场,后脚就被最大的竞争对手Anthropic超越了。刚刚,Anthropic发布了全新大模型Claude3.5Sonnet,号称是迄今为止最智能的模型。据介绍,Claude3.5Sonnet是Anthropic即将推出的Claude3.5系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强Claude3Opus。与此同时,运行速度、成本与自家前代Claude3Sonnet相当。地址:ht
- 人工智能 1244 2024-06-22 01:08:30
-
- Luma、Runway轮番炸场,视频生成卷出新高度,Sora还能称霸吗?来这场WAIC视频生成论坛寻找答案
- 2023年PIKA发布时,马斯克曾论断称2024年将是「人工智能电影」元年。年初Sora惊艳亮相、大杀四方,接着StableVideoDiffusion、LTXStudio、谷歌Veo轮番炸场,再到近期的可灵、Luma和Runway隔空斗法……短短半年时间,众多AI视频应用如雨后春笋般涌现,不仅将视频生成技术推向了新的高度,而且拓展了AI视频的应用范围,赋予未来更多可能性。如今,发展多模态能力已成为AIGC应用的大势所趋,伴随着视频生成技术的不断完善,以及越来越多AI+产业方向
- 人工智能 1254 2024-06-21 22:00:23