- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
- MetaFAIR联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。据所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个GPU。以LLaMA270B模型为例,其训练总共需要1,720,320个GPU小时。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。最近,许多机构在训练SOTA生成式AI模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的PaLM模型训练过程中出现了多达20次的损失尖峰。数值偏差是造成这种训练不准确性的根因,
- 人工智能 678 2024-05-30 13:24:53
-
- 一文带您了解数据模型:概念模型、逻辑模型和物理模型
- 数据模型是组织数据管理的基石,是构建信息基础设施的关键组成部分。数据模型为组织提供了清晰的数据结构和逻辑框架,使得数据管理更加高效和可持续。在数字化时代,数据已成为企业最宝贵的资产之一,而数据模型的设计和实施,则决定了数据在企业运营和决策中的有效性和可信度。良好的数据模型不仅能够够简化复杂的数据景观,提高数据质量和一致性,还能够够优化数据库性能,支持数据分析和决策制定。因此,数据模型的意义在于为企业提供了数据驱动的决策支持,促进了业务的创新和竞争力的提升。在为企业提供了数据驱动的决策支持,促进了
- 人工智能 792 2024-05-30 12:00:35
-
- 图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
- 这几天,AI届的盛会——ICLR在维也纳举办。OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。毫无意外地,ICLR2024展厅也变成了追星现场。热闹的气氛,快把屋顶掀翻了。现场追星图灵巨头图灵三巨头中的著名「e人」LeCun,提前就在X上大方公布出自己的行程,满怀期待地等着和粉丝们相见了。在评论区,不仅有粉丝激动打卡,甚至还有准备现场递简历的。粉丝们果然不虚此行,在现场,LeCun口若悬河地讲解,热情的观
- 人工智能 599 2024-05-30 11:17:17
-
- 多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级
- 编辑|白菜叶许多临床任务需要了解专业数据,例如医学图像、基因组学等。这类专业知识信息在通用多模态大模型的训练中通常不存...在上一篇论文的描述中,Med-Gemini在各种医学成像任务上超越GPT-4系列模型实现了SOTA!在这里,GoogleDeepMind撰写了第二篇关于Med-Gemini的论文。在Gemini的多模态模型的基础上,该团队为Med-Gemini系列开发了多个模型。这些模型继承了Gemini的核心功能,并通过2D和3D放射学、组织病理学、眼科、皮肤病学和基因组数据的微调,针对
- 人工智能 1171 2024-05-30 10:13:19
-
- 四款值得推荐的AI辅助编程工具(支持C#语言)
- 前言在这个AI迅速发展的阶段,涌现出了一大批好用的AI辅助编程工具。AI辅助编程工具能够提高开发效率、改善代码质量、降低bug率,是现代软件开发过程中的重要助手。今天大姚给大家分享4款AI辅助编程工具(并且都支持C#语言),希望对大家有所帮助。AI辅助编程工具图片GitHubCopilotGitHubCopilot是一款AI编码助手,可以帮助你更快、更省力地编写代码,从而将更多精力集中在问题解决和协作上。GitHubCopilot会在你编码时提供建议:有时是当前行的补全,有时是全新的代码块。可以
- 人工智能 617 2024-05-30 10:03:11
-
- 优秀Agent智能体必学的几种设计模式,一学就会
- 大家好,我是老渡。昨天在公司听了清华大学智能产业研究院现场分享的AI医院小镇。图片这是一个虚拟世界,所有的医生、护士、患者都是由LLM驱动的Agent智能体,可以自主交互。它们模拟了整个诊病看病的过程,在浸盖主要呼吸道疾病的MedQA数据集子集上,实现了高达93.06%的最新准确率。一个优秀的智能体,离不开优秀的设计模式。看完这个案例,我赶紧拜读了吴恩达老师最近发表的4种主要的Agent设计模式。吴恩达是人工智能和机器学习领域国际上最权威的学者之一然后,赶紧整理出来,跟大家分享一下。模式一、反思
- 人工智能 793 2024-05-30 09:44:20
-
- 超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定
- 写在前面今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低光条件、动态光照、弱纹理区域和严重抖动等挑战性场景中的适应性。我们的系统支持多种模式,包括拓展单目、立体、单目-惯性以及立体-惯性配置。除此之外,还分析了如何将视觉SLAM与深度学习方法相结合,以启发其他研究。通过在公共数据集和自采样数据上的广泛实验,展示了SL-SLAM在定位精度和跟踪鲁棒性方面优
- 人工智能 562 2024-05-30 09:35:24
-
- 最详细人脑3D地图登Science!GPT-4参数只相当于人类0.2%
- 芝麻粒大小的人脑组织,突触规模就相当于一个GPT-4!谷歌与哈佛联手,对局部人脑进行了纳米级建模,论文已登Science。这是迄今为止最大、最详细的人脑复制品,首次展示出了大脑中的突触连接网络。凭借超高分辨率,这个名为H01的重建,已经揭示了一些以前未曾见过的关于人类大脑的细节。项目通讯作者、哈佛大学Lichtman教授介绍说,在此之前,没有人真正看到过这样复杂的突触网络。这一建模成果,将有助于深入地了解大脑的运作方式,启发人类对大脑功能和疾病的进一步研究。另外值得一提的是,该研究涉及了1立方毫
- 人工智能 537 2024-05-29 17:03:30
-
- 字节开源大模型量化新思路,2-bit量化模型精度齐平fp16
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。最近,字节跳动推出了一个全新的量化思路,抛弃传统的量化范式,
- 人工智能 700 2024-05-29 09:29:50
-
- 综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
- 推荐系统对于应对信息过载挑战重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。然而,由于数据稀疏性的问题,传统的监督学习方法在实际应用中临挑战,这限制了它们有效学习用户表现的能力。为了保护克服这一难题,自监督学习(SSL)技术应用于生,其利用数据的内在结构生成监督信号,不完全依赖于标记数据。这种方法使用得推荐系统能够够利用未标记的数据提取有意义的信息,即使在数据稀缺的情况下也能做出准确的预测和推荐。文章地址:https://
- 人工智能 938 2024-05-09 16:58:02
-
- LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
- 写在前面&笔者的个人理解这篇论文致力于解决当前多模态大语言模型(MLLMs)在自动驾驶应用中存在的关键挑战,即将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆(AVs)需要针对3D环境做出准确的决策,这一扩展显得尤为重要。3D空间理解对于AV来说至关重要,因为它直接影响车辆做出明智决策、预测未来状态以及与环境安全互动的能力。当前的多模态大语言模型(如LLaVA-1.5)通常仅能处理较低分辨率的图像输入(例如),这是由于视觉编码器的分辨率限制,LLM序列长度的限制。然而,自动驾驶应用需
- 人工智能 383 2024-05-09 16:55:01
-
- 通义千问APP更名为通义APP,免费开放通义全栈能力
- 5月9日,通义大模型品牌升级,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”,成为每个人的全能AI助手。通义意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。通义APP拥有超强文档处理能力,单次可处理多达1000万字的长文档,还能同时解析100份不同格式的文档,是金融、法律、科研、医
- 人工智能 895 2024-05-09 15:25:01
-
- 揭秘DeDoDe v2:如何革新关键点检测技术,让AI'眼”更明亮?
- 一、技术革新,DeDoDev2应运而生在图像处理和计算机视觉领域,关键点检测是许多应用的基础,如目标识别、图像匹配、三维重建等。然而,传统的关键点检测技术往往存在着在检测不准确、易受噪声干扰等问题。为了解决这些问题,Linköping大学等科研团队推出了DeDoDev2,这款全新的关键点检测器,通过深入分析DeDoDe的不足之处,并针对性地进行改进和优化。二、突破瓶颈,DeDoDev2的三大创新点解决关键点聚类问题在DeDoDe中,研究人员发现关键点往往容易在特定区域聚集,导致在其他区域检测不足
- 人工智能 1132 2024-05-09 14:55:01
-
- LidaRF:研究用于街景神经辐射场的激光雷达数据(CVPR\'24)
- 光真实感模拟在自动驾驶等应用中发挥着关键作用,其中神经网络辐射场(NeRFs)的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而,由于街道上相机运动的高度共线性和在高速下的稀疏采样,街景的重建质量受到影响。另一方面,该应用通常需要从偏离输入视角的相机视角进行渲染,以准确模拟如变道等行为。LidaRF提出了几个见解,允许更好地利用激光雷达数据来改善街景中NeRF的质量。首先,框架从激光雷达数据中学习几何场景表示,这些表示与基于隐式网格的解码器相结合,从而提供了由显示点云提供的更强的几何信
- 人工智能 818 2024-05-09 13:31:37
-
- 任天堂闪击GitHub,一夜删光8000多个模拟器代码仓库
- 任天堂闪击GitHub!一夜之间删除了8535个代码库。只要包含YuzuSwitch模拟器代码都不放过,称其非法绕过了任天堂的技术保护措施,并运行了非法盗版Switch游戏。GitHub这边也作出了回应。开发者有时间可对侵权内容进行删除或更改。此外,GitHub还为开发者提供关于如何提交DMCA(美国的一部版权法)反通知的法律资源和指导。此事一出,网友们也是炸开了锅,支持任天堂、支持Yuzu的声音都有。有网友提议,都别吵:我们用钱包投票吧!还有网友起猛了以为是删除所有任天堂模拟器:幸好只是和Yu
- 人工智能 878 2024-05-09 12:46:28