- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com当前的视觉语言模型(VLM)主要通过QA问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如detailimagecaption性能的可靠评测手段。针对这一问题,中科院、
- 人工智能 926 2024-07-18 20:10:02
-
- 三星中国Galaxy Z系列新品接入豆包大模型
- 7月17日,三星电子面向中国市场发布新一代GalaxyZ系列产品。会上,三星电子与火山引擎官宣合作,为GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型,提升手机的智能应用体验。此前,三星在海外新品发布会上公布了与谷歌Gemini的深度合作,在中国区则选择了火山引擎等厂商作为大模型合作方。fenye图说:三星GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型除了画圈即搜、实时翻译、录音转录等已经披露过的AI功能外,本次中
- 人工智能 644 2024-07-18 20:07:33
-
- 抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com一作刁海文,是大连理工大学博士生,导师是卢湖川教授。目前在北京智源人工智能研究院实习,指导老师是王鑫龙博士。他的研究兴趣是视觉与语言,大模型高效迁移,多模态大模型等。共同一作崔
- 人工智能 423 2024-07-18 19:21:11
-
- 这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
- 四大VLM,竟都在盲人摸象?让现在最火的SOTA模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,他们表现会比人类好吗?答案很可能是否定的。自GPT-4V推出以来,视觉语言模型(VLMs)让大模型的智能程度朝着我们想象中的人工智能水平跃升了一大步。VLMs既能看懂画面,又能用语言来描述看到的东西,并基于这些理解来执行复杂的任务。比如,给VLM模型发去一张餐桌的图片,再发一张菜单的图片,它就能从两张图中分别提取啤酒瓶的数量和菜单上的单价,算
- 人工智能 690 2024-07-18 18:18:02
-
- MotionClone:无需训练,一键克隆视频运动
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。论文:https://arxiv.org/abs/2406.05
- 人工智能 1044 2024-07-18 17:06:12
-
- 人类模仿AI新赛道,AI:论疯癫,你是我爹
- 机器之能报道编辑:杨文AI被人类带坏!这个世界,太癫了……最近,社交媒体上冒出来一堆搞怪视频,打着AI的旗号,真人cosAI,甚至抖音还专门出了个热门话题——人类模仿AI大赛。(视频来自抖音博主「关妮乱石」)视频链接:https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlw套路都一个样儿:左边一张旧照片,右边打着「AI修复」的字幕,实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI:第一次被人冒充,没想到比我还抽
- 人工智能 1788 2024-07-18 16:51:08
-
- 大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
- 大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的LLM。这导致传统自回归解码的速度较慢。近日,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布EAGLE,旨在提升大语言模型的推理速度,同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量,能够显着提升生成效率。技术报告:https://sites.google.com/view
- 人工智能 1044 2024-07-18 14:43:48
-
- 有效评估Agent实际表现,新型在线评测框架WebCanvas来了
- 潘奕琛:浙江大学硕士一年级研究生。孔德涵:跨越星空科技模型算法负责人。周思达:南昌大学2024届毕业生,将于西安电子科技大学攻读硕士。崔成:浙江中医药大学2024届毕业生,将于苏州大学攻读硕士。潘奕琛、周思达、崔成以跨越星空科技算法实习生的身份共同完成了本论文的研究工作。在当今科技迅速发展的时代,大型语言模型(LargeLanguageModel,LLM)正以前所未有的速度改变着我们与数字世界的互动方式。基于LLM的智能代理(LLMAgent),从简单的信息搜索到复杂的网页操作,它们正在逐步融入
- 人工智能 636 2024-07-18 14:04:51
-
- AKOOL助力戛纳广告大奖,发布革命性实时数字人平台
- 2024年欧洲杯如火如荼进行之际,一则由法国电信公司Orange创作的足球比赛视频也迅速走红。视频中,我们看到了姆巴佩、吉鲁、格里兹曼......,实际上,所有在球场上奔跑的运动员都不是真人,而是人工智能生成的虚拟角色。凭借出色创意和独特性,该作品斩获了广告创意营销界“奥斯卡”——今年的戛纳国际创意节的体育类大奖。而AKOOL为这一大奖作品提供了核心技术支持。他们开发的AI面部捕捉系统能精确捕捉人脸细微表情和动作,在精心设计的渲染技术加持下,作品中的虚拟人物
- 人工智能 565 2024-07-18 09:26:11
-
- 178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离
- 上海交大&上海AILab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下,人工智能的发展近来取得了巨大进步,尤其是OpenAI的GPT-4,其在问答、知识方面展现出的强大能力点亮了AI领域的尤里卡时刻,引起了公众的普遍关注。GPT-4V(ision)是OpenAI最新的多模态基础模型。相较于GPT-4,它增加了图像与语音的输入能力。该研究则旨在通过案例分析评估GPT-4V(ision)在多模态医疗诊断领域的性能,一共展现并分析共计了1
- 人工智能 1262 2024-07-18 06:20:10
-
- ICML 2024 AI for Math Workshop 征稿和挑战赛启动!
- ICML2024,AIforMathWorkshop面向形式化和自然语言AI数学推理的研讨会时间:2024年7月26/27日地点:奥地利,维也纳。现场、线上同步举行。研讨会主页:https://sites.google.com/view/ai4mathworkshopicml2024/数学推理是人类智能中最具挑战性和最具深度的部分。人类在数学推理的发展进程中总结出了各种形式化语言,得以严格地描述数学问题和证明过程。而近年来的机器学习算法和大规模语言模型正在逐步接近甚至超越人类在一些数学推理的表现
- 人工智能 752 2024-07-18 05:36:50
-
- Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%
- 研究者表示,如果Sytem2蒸馏可以成为未来持续学习AI系统的重要特征,则可以进一步提升System2表现不那么好的推理任务的性能。谈到大语言模型(LLM)的策略,一般来说有两种,一种是即时的System1(快速反应),另一种是System2(慢速思考)。其中System2推理倾向于深思熟虑的思维,生成中间思维允许模型(或人类)进行推理和规划,以便成功完成任务或响应指令。在System2推理中,需要付出努力的心理活动,尤其是在System1(更自动化思维)可能出错的情况下。因此,System1被
- 人工智能 1175 2024-07-18 05:07:20
-
- 直击真实的甲方AGI需求,人工智能赋能产业融通发展论坛顺利召开
- 7月6日,「2024WAIC人工智能赋能产业融通发展论坛」在世博展览馆隆重举行。本次论坛主要议题为探讨人工智能赋能新型工业化、促进产业融通发展的相关问题,包括领导致辞、签约仪式、主题演讲、央国企人工智能场景需求发布和圆桌论坛等多个环节。众多来自央国企机构和人工智能领域的企业参与,包括中国电子信息产业发展研究院、中国移动研究院、中国石化胜利油田、国家电网客服中心、中电昱创、南方电网数字电网集团、达摩院、百度智能云、创新奇智等。出席嘉宾围绕人工智能在不同领域的应用实践、大模型的发展与应用、智能化运维
- 人工智能 575 2024-07-18 03:14:57
-
- 赶时髦的 AIGC 营销人,如何实现「里子」与「面子」的双赢?
- AIGC技术在营销领域的创新与安全过去一年,AI技术在各行各业掀起了一场变革狂潮。向来「赶时髦」的营销圈,更是率先拥抱AIGC技术。相关数据显示,2023年,我国已有近半数广告主企业在线上营销活动中应用AIGC技术,其中超过90%的应用聚焦于内容创作和创意开发。这种由技术驱动的广告营销新模式正在逐渐成型,为广告主降本增效带来更多可能。然而,AIGC技术在营销领域大施拳脚的同时,也伴随着诸多挑战。例如,AIGC技术在生成营销素材时可能会产生内容风险,重金投入的营销活动一不小心为黑产做了嫁衣。那么,
- 人工智能 874 2024-07-18 01:41:21
-
- ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文论文一作是南开大学统计与数据科学学院研二硕士生杨雨辰,指导老师为南开大学统计与数据科学学院的徐君副教授。徐君老师团队的研究重点是计算机视觉、生成式AI和高效机器学习,并在顶
- 人工智能 775 2024-07-18 01:39:51