第 50 页-探索人工智能技术的未来

当前位置：首页 > 技术文章 > 科技周边 > 人工智能

方向：: 全部网络3.0 后端开发 web前端数据库运维开发工具 php框架每日编程微信小程序常见问题其他科技 CMS教程 Java 系统教程电脑教程硬件教程手机教程软件教程手游教程

分类：: 人工智能 IT业界

最热

最新

独家对话李岩：宿华、经纬、红点资金支持，第一个「生成式推荐」创业公司｜AI Pioneers

人类正在迎来人工智能领域的爆炸式更新，技术向未知拓展的每一步，几乎都引起惊人的关注度。在人工智能边界扩张的过程中，重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择，影响着众多跟随者的脚步。过去一年，本站独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家，为他们在互联网世界留下了第一份“万字访谈底稿”。在技术路线尚未收敛的阶段，我们看到了到真正拥有信念、勇气以及系统化认知的AI创业者的引领力量。因此，我们推出“AIPioneers”的

人工智能 880 2024-07-19 05:03:59
OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

如果AI模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，解释并支持其决策。对于大型语言模型来说，我们也可以采用类似的方法。不过，在采用这种方法时，确保语言模型生

人工智能 769 2024-07-19 01:29:52
清华包揽最佳论文+时间检验奖，山大获荣誉提名，SIGIR 2024奖项出炉

清华成绩亮眼。第47届国际计算机协会信息检索大会（ACMSIGIR）于2024年7月14日至18日在美国华盛顿特区举行。该会议是信息检索领域的顶级学术会议。刚刚，大会公布了最佳论文奖、最佳论文亚军、最佳论文荣誉提名奖以及时间检验奖等奖项。其中，清华大学、中国人民大学高瓴人工智能学院、小红书团队获得了最佳论文；来自格拉斯哥大学、比萨大学的研究者摘得亚军；最佳论文荣誉提名奖颁给了山东大学（青岛）、莱顿大学、阿姆斯特丹大学的研究者；时间检验奖颁给了清华大学、加州大学圣克鲁斯分校的研究者。接下来，我们来

人工智能 498 2024-07-19 00:06:43
登Science，药物亲和力增加37倍，AI对蛋白、抗体复合物进行无监督优化

编辑|萝卜皮蛋白质参与了细胞组成、肌肉收缩、消化食物、识别病毒等众多生物学功能。为了设计出更好的蛋白质（包括抗体），科学家经常在不同位置反复变异氨基酸（按一定顺序排列组成蛋白质的单位），直到使蛋白质获得所需要的功能。但氨基酸序列的数量比世界上的沙粒还要多，因此找到最佳蛋白质，进而找到最佳潜在药物，通常难度巨大。当面临这一挑战时，科学家通常会花费数百万美元，并在微型化、简化版的生物系统中进行测试。「这需要大量的猜测和验证。」斯坦福大学（StanfordUniversity）化学工程助理教授兼Arc

人工智能 769 2024-07-18 22:22:51
大脑如何处理语言？普林斯顿团队对Transformer模型进行分析

编辑|萝卜皮在处理语言时，大脑会部署专门的计算来从复杂的语言结构中构建含义。基于Transformer架构的人工神经网络是自然语言处理的重要工具。普林斯顿大学的研究人员探讨了Transformer模型和人类大脑在语言处理中的功能特殊化问题。Transformer通过结构化电路计算整合单词间的上下文信息。不过，当前的研究主要集中于这些电路生成的内部表征（「嵌入」）。研究人员直接分析电路计算：他们将这些计算解构为功能专门的「transformations」，将跨词语的上下文信息整合在一起。利用参与者

人工智能 686 2024-07-18 20:52:41
豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com当前的视觉语言模型（VLM）主要通过QA问答形式进行性能评测，而缺乏对模型基础理解能力的评测，例如detailimagecaption性能的可靠评测手段。针对这一问题，中科院、

人工智能 768 2024-07-18 20:10:02
三星中国Galaxy Z系列新品接入豆包大模型

7月17日，三星电子面向中国市场发布新一代GalaxyZ系列产品。会上，三星电子与火山引擎官宣合作，为GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型，提升手机的智能应用体验。此前，三星在海外新品发布会上公布了与谷歌Gemini的深度合作，在中国区则选择了火山引擎等厂商作为大模型合作方。fenye图说：三星GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型除了画圈即搜、实时翻译、录音转录等已经披露过的AI功能外，本次中

人工智能 535 2024-07-18 20:07:33
抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com一作刁海文，是大连理工大学博士生，导师是卢湖川教授。目前在北京智源人工智能研究院实习，指导老师是王鑫龙博士。他的研究兴趣是视觉与语言，大模型高效迁移，多模态大模型等。共同一作崔

人工智能 341 2024-07-18 19:21:11
这些VLM竟都是盲人？GPT-4o、Sonnet-3.5相继败于「视力」测试

四大VLM，竟都在盲人摸象？让现在最火的SOTA模型们（GPT-4o，Gemini-1.5，Sonnet-3，Sonnet-3.5）数一数两条线有几个交点，他们表现会比人类好吗？答案很可能是否定的。自GPT-4V推出以来，视觉语言模型(VLMs)让大模型的智能程度朝着我们想象中的人工智能水平跃升了一大步。VLMs既能看懂画面，又能用语言来描述看到的东西，并基于这些理解来执行复杂的任务。比如，给VLM模型发去一张餐桌的图片，再发一张菜单的图片，它就能从两张图中分别提取啤酒瓶的数量和菜单上的单价，算

人工智能 609 2024-07-18 18:18:02
MotionClone：无需训练，一键克隆视频运动

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com无需训练或微调，在提示词指定的新场景中克隆参考视频的运动，无论是全局的相机运动还是局部的肢体运动都可以一键搞定。论文：https://arxiv.org/abs/2406.05

人工智能 971 2024-07-18 17:06:12
人类模仿AI新赛道，AI：论疯癫，你是我爹

机器之能报道编辑：杨文AI被人类带坏！这个世界，太癫了……最近，社交媒体上冒出来一堆搞怪视频，打着AI的旗号，真人cosAI，甚至抖音还专门出了个热门话题——人类模仿AI大赛。（视频来自抖音博主「关妮乱石」）视频链接：https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlw套路都一个样儿：左边一张旧照片，右边打着「AI修复」的字幕，实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI：第一次被人冒充，没想到比我还抽

人工智能 1580 2024-07-18 16:51:08
大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每个词（token）的生成都需要进行一次前向传播，需要访问数十亿至数千亿参数的LLM。这导致传统自回归解码的速度较慢。近日，滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布EAGLE，旨在提升大语言模型的推理速度，同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量，能够显着提升生成效率。技术报告：https://sites.google.com/view

人工智能 873 2024-07-18 14:43:48
有效评估Agent实际表现，新型在线评测框架WebCanvas来了

潘奕琛：浙江大学硕士一年级研究生。孔德涵：跨越星空科技模型算法负责人。周思达：南昌大学2024届毕业生，将于西安电子科技大学攻读硕士。崔成：浙江中医药大学2024届毕业生，将于苏州大学攻读硕士。潘奕琛、周思达、崔成以跨越星空科技算法实习生的身份共同完成了本论文的研究工作。在当今科技迅速发展的时代，大型语言模型（LargeLanguageModel，LLM）正以前所未有的速度改变着我们与数字世界的互动方式。基于LLM的智能代理（LLMAgent），从简单的信息搜索到复杂的网页操作，它们正在逐步融入

人工智能 512 2024-07-18 14:04:51
AKOOL助力戛纳广告大奖，发布革命性实时数字人平台

2024年欧洲杯如火如荼进行之际，一则由法国电信公司Orange创作的足球比赛视频也迅速走红。视频中，我们看到了姆巴佩、吉鲁、格里兹曼......，实际上，所有在球场上奔跑的运动员都不是真人，而是人工智能生成的虚拟角色。凭借出色创意和独特性，该作品斩获了广告创意营销界“奥斯卡”——今年的戛纳国际创意节的体育类大奖。而AKOOL为这一大奖作品提供了核心技术支持。他们开发的AI面部捕捉系统能精确捕捉人脸细微表情和动作，在精心设计的渲染技术加持下，作品中的虚拟人物

人工智能 421 2024-07-18 09:26:11
178页，128个案例，GPT-4V医疗领域全面测评，离临床应用与实际决策尚有距离

上海交大&上海AILab发布178页GPT-4V医疗案例测评，首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下，人工智能的发展近来取得了巨大进步，尤其是OpenAI的GPT-4，其在问答、知识方面展现出的强大能力点亮了AI领域的尤里卡时刻，引起了公众的普遍关注。GPT-4V(ision)是OpenAI最新的多模态基础模型。相较于GPT-4，它增加了图像与语音的输入能力。该研究则旨在通过案例分析评估GPT-4V(ision)在多模态医疗诊断领域的性能，一共展现并分析共计了1

人工智能 1147 2024-07-18 06:20:10