- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- ICML 2024 | 大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在大型语言模型的训练过程中,数据的处理方式至关重要。传统的方法通常通过将大量文档拼接并切分成等同于模型的上下文长度的训练序列。这虽然提高了训练效率,但也常导致文档的不必要截断,
- 人工智能 621 2024-06-02 21:42:20
-
- 腾讯混元大模型全面降价!混元-lite即日起免费
- 5月22日,腾讯云公布全新大模型升级方案。主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。混元-standardAPI输入价格从0.01元/千tokens降至0.0045元/千tokens,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。新上线的混元-standard-256k,具备处理超过38万字符的超长文本能力,API输入价格下调至0.015元/千toke
- 人工智能 418 2024-06-02 20:07:09
-
- 牛津大学最新 | 近400篇总结!畅谈大语言模型与三维世界最新综述
- 写在前面&笔者的个人理解随着大型语言模型(LLM)的发展,它们与3D空间数据(3DLLM)之间的集成取得了快速进展,为理解物理空间和与物理空间交互提供了前所未有的能力。本文全面概述了LLM处理、理解和生成3D数据的方法。我们强调了LLM的独特优势,如上下文学习、逐步推理、开放词汇能力和广泛的世界知识,并强调了它们与嵌入式人工智能(AI)系统中显示推进空间理解和互动的潜力。我们的研究涵盖了从点云到神经渲染场(NeRF)的各种3D数据表示。并分析了它们与LLM的集成,用于3D场景理解、字幕、
- 人工智能 389 2024-06-02 19:41:32
-
- 一文读懂构建多代理的 AutoGen 开源框架
- Hellofolks,我是Luga,今天我们来聊一下人工智能(AI)生态领域相关的技术-AutoGen-一个统一的多代理对话框架。想象一下这样一个场景:我们不再是单枪匹马独自作战,而是拥有一支高度个性化、跨领域整合的人工智能团队。每位团队成员都在自己的领域内娴熟专业,互相配合无缝,沟通高效,永不疲惫。他们能够够高度协作,应对复杂多变的挑战。这便是AutoGen的精髓所在——一个开创性的多智能体对话框架。AutoGen+赋予我们无限可能,让我们能随心所欲组建专属的战略人工智能团队。每位成员都拥有独
- 人工智能 1128 2024-06-02 19:12:02
-
- 不止3D高斯!最新综述一览最先进的3D重建技术
- 写在前面&笔者的个人理解基于图像的3D重建是一项具有挑战性的任务,涉及从一组输入图像推断目标或场景的3D形状。基于学习的方法因其直接估计3D形状的能力而受到关注。这篇综述论文的重点是最先进的3D重建技术,包括生成新颖的、看不见的视图。概述了高斯飞溅方法的最新发展,包括输入类型、模型结构、输出表示和训练策略。还讨论了尚未解决的挑战和未来的方向。鉴于该领域的快速进展以及增强3D重建方法的众多机会,对算法进行全面检查似乎至关重要。因此,本研究对高斯散射的最新进展进行了全面的概述。(大拇指往上滑
- 人工智能 844 2024-06-02 18:57:35
-
- 用GPT-3.5生成数据集!北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景
- 高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。那么,EdittheWorld试试。图片北京大学、TiamatAI、天工AI、Mila实验室提出了EditWorld,他们引入了一种新的编辑任务,即世界指令(world-instructed)图像编辑。它定义和分类基于各种世界场景的指令。图片在一组预训练模型,比如GPT-3.5、Video-LLava和SDXL的支持下,建立了一个带有世界指令的多模态数据集。在该数据集训练了一个基于扩散的图像编辑模型EditWorld,结果在其新任务的
- 人工智能 825 2024-06-02 17:18:08
-
- 目标检测新SOTA,端侧实时识别,沉向洋罕见转发点赞
- 目标检测领域,迎来了新进展——GroundingDINO1.5,IDEA研究院团队出品,在端侧就可实现实时识别。这一进展获得AI大佬沉向洋转发,他一般都是一年一转的节奏。此次发布主要有两个版本:Pro和Edge。 Pro版更强,Edge版更快。它仍然保留了上一个版本GroundingDINO双编码器-单解码器结构,在此基础上通过结合更大的视觉backbone扩大模型尺寸,并使用超过2000万的Grounding数据获得了丰富的语料,大幅提升了检测精度和速度,且通过Pro和Edge版本分别针对不同应
- 人工智能 1170 2024-06-02 16:41:05
-
- DiffMap:首个利用LDM来增强高精地图构建的网络
- 论文标题:DiffMap:EnhancingMapSegmentationwithMapPriorUsingDiffusionModel论文作者:PeijinJia,TuopuWen,ZiangLuo,MengmengYang,KunJiang,ZhiquanLei,XueweiTang,ZiyuanLiu,LeCui,KehuaSheng,BoZhang,DiangeYang01背景简介自动驾驶车辆辆来说,高清(HD)地图能够够帮助其提高对环境理解(感知)的准确度和导航的精度。然而,人工建图面
- 人工智能 835 2024-06-02 16:26:44
-
- 一文读懂 GPT-4o vs GPT-4 Turbo
- Hellofolks,我是Luga,今天我们来聊一下人工智能(AI)生态领域相关的技术-GPT-4o模型。在2024年5月13日,OpenAI创新性地推出了其最先进、最前沿的模型GPT-4o,这是标志着人工智能聊天机器人和大型语言模型领域实现重大突破的举措。预示着人工智能能力的新时代,GPT-4o拥有显着的性能增强,在速度和多功能性方面都超越了其前身GPT-4。这一突破性的进步解决了经常困扰其前身的延迟问题,确保了无缝且响应迅速的用户体验。什么是GPT-4o?2024年5月13日,OpenAI发
- 人工智能 718 2024-06-02 16:02:40
-
- 自动驾驶第一性之纯视觉静态重建
- 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速传感器的数据进行动态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如果从量产的角度做数据闭环,把这些传感器都用上,可以有效地解决动态物体的标注问题。但是我们的方案里面,是没有固态雷达的。所以,我们就介绍这种最通用的量产标注方案。纯视觉的标注方案的核心在于高精度的pose重建。我们采用StructurefromMotion(SFM)的pose重建方案,来保证重建精度。但是传
- 人工智能 758 2024-06-02 15:24:40
-
- 思维链不存在了?纽约大学最新研究:推理步骤可省略
- 红极一时的思维链技术,可能要被推翻了!还在惊讶于大模型居然能够利用思维链分步骤思考?还在苦于不会写思维链提示词?来自纽约大学的研究人员表示:「没关系的,都一样」,推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。论文地址:https://arxiv.org/pdf/2404.15758这篇文章的标题甚至直接用「Let’sthinkdotbydot」,来对标思维链的「Let’sthinkstepbystep」,展现了「省略号」的威力。「点点点」的威力研究人员发现,把思维链(Chain-o
- 人工智能 417 2024-06-02 15:21:41
-
- 微软发布Copilot智能体 还带来了本机小语言模型
- 2022年5月22日消息,当地时间周二,微软在Build开发者大会上发布了Copilot新智能体,它就像虚拟员工一样,能自动执行任务。微软认为,这种人工智能将消除枯燥乏味的工作内容,而不是完全取代员工工作。微软的Copilot是基于开源代码模型GPT-3开发的,它使用了大量的代码库和算法,以帮助开发人员更高效地编写代码。Copilot能够分析上下文并生成与之匹配的代码片段,从而大大加快了开发的速度和质量。然而,Copilot的功能仍然有限,并不能完全替代人工智能。它通常除此外,微软还针对Copi
- 人工智能 390 2024-06-02 14:56:12
-
- 为什么人工智能可以给数学带来革命性变化
- 编辑|白菜叶「提出一个猜想——一个被怀疑为真的命题,但需要明确的证明——对数学家来说就像是神圣灵感的时刻。数学猜想不仅仅是有根据的猜测。制定它们需要天才、直觉和经验的结合。即使是数学家也很难解释自己的发现过程。然而,与直觉相反,我认为这是机器智能最初最具变革性的领域。」英国伦敦数学科学研究所所长ThomasFink说。2017年,伦敦数学科学研究所的研究人员开始将机器学习应用于数学数据,作为一种爱好。在COVID-19大流行期间,他们发现简单的人工智能(AI
- 人工智能 622 2024-06-02 14:47:39
-
- 自动驾驶场景中的长尾问题怎么解决?
- 昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原因之一。自动驾驶的底层架构和大部分技术问题已经被解决,剩下的5%的长尾问题,逐渐成了制约自动驾驶发展的关键。这些问题包括各种零碎的场景、极端的情况和无法预测的人类行为。自动驾驶中的边缘场景"长尾"是指自动驾驶汽车(AV)中的边缘情况,边缘情况是发生概率较低的可能场景。这些罕见的事件
- 人工智能 1249 2024-06-02 14:44:00
-
- IBM向开源社区发布Granite AI模型
- IBM研究院最近宣布对其Granite编码基础模型开源,目标是实现高级AI工具大众化,进而推动跨行业代码编写、维护与开发方式的全面变革。此举将使开发者能够更加高效地创建、优化和部署AI模型,从而加速人工智能技术的应用。Granite是IBM研究院开发的一种先进的AI编程工具,具备强大的功能。它基于开放标IBM的Granite编码模型是什么水平?Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所固有的复杂性与快速开发需求之后,IBM利用其强大的科研能力构建起一套AI驱动工具,旨在
- 人工智能 784 2024-06-02 13:46:40