- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 简单通用:视觉基础网络3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024
- 本讨论文作者王语霖是清华大学自动化系2019级直博生,师从吴澄院士和黄高副教授,主要研究方向为高效深度学习、计算机视觉等。他曾以第一作者在TPAMI、NeurIPS、ICLR、ICCV、CVPR、ECCV等期刊、会议上发表讨论文,曾获百度奖学金、微软学者、CCF-CV学术新锐奖、字节跳动奖学金等荣誉。个人主页:wyl.cool。本文主要介绍刚刚被IEEETransactionsonPatternAnalysisandMachineIntelligence(TPAMI)录用的一篇文章:Effici
- 人工智能 935 2024-06-10 14:54:28
-
- 高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com3D重建和新视图合成技术在虚拟现实和增强现实领域有着广泛的应用。 NeRF通过隐式地将场景编码为射线场景,在视图合成上取得了显着的成功。然而,由于NeRF依赖于耗时的逐点查询密集
- 人工智能 891 2024-06-10 14:24:57
-
- 李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型
- 在不久之前的2024TED演讲中,李飞飞详细解读了空间智能(SpatialIntelligence)概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱,并为此正在创建初创公司在此演讲中,曾提到斯坦福团队的一个研究成果BEHAVIOR,这是他们“创建”的一个用来训练计算机和机器人如何在三维世界中行动的行为和动作数据集。BEHAVIOR是一个庞大的数据集,包含了各种不同场景下的人类行为和动作。这个数据集的目的是为了让计算机和机器人更好地理解和模仿人类的行为。通过分析BEHAVIOR中的
- 人工智能 1146 2024-06-10 14:04:57
-
- 开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
- 车路协同的同步驾驶数据车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aidedautonomousdriving)在提供更安全的驾驶策略方面具有巨大潜力。研究者们在V2X-AD的通信和通信层面进行了大量的研究,但是这些基础设施和通信资源在提高驾驶性能方面的效果仍未得到充分探索。这突显了研究协同自动驾驶的必要性,即如何设计面向驾驶规划的高效信息共享策略,从而提高每辆汽车驾驶性能。这需要两个关键的基础条件:一个是能够为V2X-AD提供数据环境的平台,以及一个具有驾驶
- 人工智能 440 2024-06-10 12:42:28
-
- GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
- GPT-4可以通过图灵测试吗?当一个足以强大的模型诞生之后,人们往往会用图灵测试去衡量这一LLM的智能程度。最近,来自UCSD的认知科学系研究人员发现:在图灵测试中,人们根本无法区分GPT-4与人类!论文地址:https://arxiv.org/pdf/2405.08007在图灵测试中,GPT-4有54%的情况下,被判定为人类。实验结果更是表明,这是首次有系统在「交互式」双人图灵测试中,被实证通过测试。研究者CameronR.Jones招募了500名志愿者,他们被分为5个角色:4个评估员,分别是
- 人工智能 1140 2024-06-10 12:32:27
-
- GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
- 最新版本大模型,6分钱100万Token。今天上午,在AI开放日上,备受关注的大模型公司智谱AI公布了一系列行业落地数字:根据最新的统计数据,智谱AI大模型开放平台目前已经获得30万注册用户,日均调用量达到400亿Tokens,其中,过去6个月API每日消费量增长达50倍以上,性能最强的GLM-4模型在过去4个月中有超过90倍的增长。在最近的清谈App中,已有超过30万个智能体活跃在智能体中心,包括许多出色的生产力工具,如思维导图、文档助手、日程安排等等。而在新技术一侧,GLM-4的最新版本GL
- 人工智能 1139 2024-06-10 11:44:17
-
- 告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能
- 人工智能 1092 2024-06-10 11:17:28
-
- 使用Rag和Sem-Rag提供上下文增强AI编码助手
- 通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应
- 人工智能 1237 2024-06-10 11:08:19
-
- Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成
- 音频生成领域又有好消息:刚刚,StabilityAI宣布推出开放模型StableAudioOpen,该模型能够生成高质量的音频数据。项目地址:https://huggingface.co/stabilityai/stable-audio-open-1.0与StabilityAI的商业StableAudio产品(可生成长达三分钟的更长、连贯的音乐曲目)不同,StableAudioOpen可通过简单的文本提供生成长达47秒的高质量音频数据。这个模型是为音乐制作和声音设计而创建的。它包括鼓点、乐器ri
- 人工智能 1003 2024-06-10 09:37:36
-
- 本地使用Groq Llama 3 70B的逐步指南
- 译者|布加迪审校|重楼本文介绍了如何使用GroqLPU推理引擎在JanAI和VSCode中生成超快速响应。每个人都致力于构建更好的大语言模型(LLM),例如Groq专注于AI的基础设施方面。这些大模型的快速响应是确保这些大模型更快捷地响应的关键。本教程将介绍GroqLPU解析引擎以及如何在笔记本电脑上使用API和JanAI本地访问它。本文还将把它整合到VSCode中,以帮助我们生成代码、重构代码、输入文档并生成测试单元。本文将免费创建我们自己的人工智能编程助手。GroqLPU推理引擎简介Groq
- 人工智能 1048 2024-06-10 09:16:58
-
- 大模型App腾讯元宝上线!混元再升级,打造可随身携带的全能AI助理
- 5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求
- 人工智能 817 2024-06-09 22:38:15
-
- 把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
- 北航的研究团队,用扩散模型“复刻”了一个地球?在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。而且地形、气候、植被等复杂的地理特征,也全都考虑到了。受GoogleEarth启发,北航的研究团队从俯拍视角出发,将整颗地球的卫星遥感影像“装进”了深度神经网络。基于这样的网络,团队构建出了覆盖全球的俯视视角视觉生成模型MetaEarth。MetaEarth拥有6亿参数,可实现多种分辨率、无界且覆盖全球任意地理位置的遥感图像生成。覆盖全球的遥感图像生成模型相比于此前的研
- 人工智能 302 2024-06-09 21:56:30
-
- Meta AI的首席执行官LeCun:不要从事LLM工作
- 出品|51CTO技术栈(微信号:blog51cto)在巴黎举行的初创企业年度技术大会VivaTech上,MetaAI的首席执行官YannLeCun建议希望在AI生态系统中工作的学生不要从事事LLM(大型语言模型)方面的工作。如果你对构建下一代AI系统感兴趣,可以不从事LLM方面的工作。这是大公司的事情,你们无法对此有所贡献,"LeCun在会议上表示。他还说,人们应该开发能够克服大型语言模型局限性的下一代AI系统。1.远离LLM有趣的是,关于LLM(大型语言模型)替代产品的讨论已经持续了
- 人工智能 786 2024-06-09 20:29:50
-
- 【论文解读】System 2 Attention提高大语言模型客观性和事实性
- 一、简要介绍本文简要介绍了论文“System2Attention(issomethingyoumightneedtoo)”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正这些问题,论文引入了System2Attention(S2A),它利用LLM的能力,用自然语言进行推理,并遵循指示,以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分,然后
- 人工智能 681 2024-06-09 20:03:51
-
- YOLOv10来啦!真正实时端到端目标检测
- 过去几年里,YOLOs因在计算成本和检测性能之间实现有效平衡而成为实时目标检测领域的主流范式。研究人员针对YOLOs的结构设计、优化目标、数据增强策略等进行了深入探索,并取得了显着进展。然而,对非极大值抑制(NMS)的后处理依赖阻碍了YOLOs的端到端部署,并对推理延迟产生负面影响。此外,YOLOs中各种组件的设计缺乏全面和彻底的审查,导致明显的计算冗余并限制了模型的性能。这导致次优的效率,以及性能提升的巨大潜力。在这项工作中,我们旨在从后处理和模型架构两个方面进一步推进YOLOs的性能-效率边
- 人工智能 1005 2024-06-09 17:29:31