- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- 单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速
- 微软的这项研究让开发者可以在单卡机器上以10倍的速度处理超过1M的输入文本。大型语言模型(LLM)已进入长上下文处理时代,其支持的上下文窗口从先前的128K猛增到10Mtoken级别。然而,由于注意力机制的二次复杂度,模型处理输入提示(即预填充阶段)并开始产生第一个token可能需要几分钟时间。导致首个token生成的时间过长,从而严重影响了用户体验,这也极大地限制了长上下文LLM的广泛应用。举例来说(如图2a所示),在单台装有A100的机器上为LLaMA-3-8B提供服务时,如果提示有30万个
- 人工智能 825 2024-07-12 17:14:05
-
- 达摩院发布一站式AI视频创作平台\'寻光\',打造全新AI工作流
- 今年是AI视频生成爆发的元年,以Sora为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于AI的视频创作方式开始流行起来。但新技术也引发更多的挑战与质疑,除了大家熟知的“开盲盒”现象,AI所生成的视频内容也因可控性差、处理工作流繁琐而频频被诟病。OpenAI曾经邀请专业视频制作团队对Sora进行了测试,其中来自于多伦多的ShyKids团队,利用Sora制作了一个气球人主题的短片,把创意和AI技术进行了完美的结合,让人印象深刻。整个短片其实并不
- 人工智能 974 2024-07-12 16:24:20
-
- ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。近年来,大型语言模型(LLM)在数学应用题和数学定理证明等任务中取得了长足的进步。数学推理需要严格的、形式化的多步推理过程,因此是LLMs推理能力进步的关键里程碑,但仍然面临
- 人工智能 1103 2024-07-12 16:07:14
-
- HANDS@ECCV24 手部研讨会和挑战赛,诚邀投稿和参与竞赛
- 简介第八届HANDS将在ECCV24(9月30日下午,米兰)举办,包含研讨会和挑战赛。HANDS将为相关手部研究人员和从业者提供一个分享工作和讨论潜在合作的平台。过去7届HANDS也取得了极大的成功。本文档属于翻译,信息以官网为准。HANDS@ECCV24主页:https://hands-workshop.org/手部研讨会和投稿:研讨会专注于手部相关方向,将邀请手部相关领域的专家做前沿报告。特别的,我们诚邀相关长文投稿。手部挑战赛:挑战赛基于最新的手部大数据集AssemblyHands、ARC
- 人工智能 1038 2024-07-12 14:12:10
-
- DALL-E 3 现在拥有集成编辑工具,但还需要改进
- 是否曾经想立即编辑您的 DALL-E 3 创作,但不知道如何进行更改? OpenAI 倾听您的声音,并在 ChatGPT 中的 DALL-E 3 中添加了内联编辑工具,使您无需离开应用程序即可对您的创作进行调整。 这
- 人工智能 769 2024-07-12 14:10:52
-
- 开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布
- 作者|上海交通大学、上海人工智能实验室编辑|ScienceAI近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(SegmentAnythinginradiologyscans,drivenbyTextprompts),在3D医学图像(CT、MR、PET)上,基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接:https://arxiv.org/abs/2312.17183代码链接:https://github.com/zhao
- 人工智能 623 2024-07-12 10:52:01
-
- 几分钟生成四维内容,还能控制运动效果:北大、密歇根提出DG4D
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者潘亮博士目前是上海人工智能实验室的ResearchScientist。此前,在2020年至2023年,他于新加坡南洋理工大学S-Lab担任ResearchFellow,
- 人工智能 1160 2024-07-12 09:30:21
-
- 陶哲轩支持!AI数学奥林匹克竞赛进步奖公布,奖金100多万美元
- 大模型做数学题到底如何,不妨让它参与一下这种级别的比赛。「AI数学奥林匹克竞赛(AIMO进步奖)的初步成绩已公布。根据排行榜的数据,目前看来,获胜的程序在私人测试中正确回答了29/50道题,这一成绩比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。AIMO起源于机器学习量化交易的非银行金融机构XTXMarkets,主要让参与者使用AI模型解决国际数学难题,而此次进步奖的目标是创建能够解决用LaTeX格式编写的复杂数学问题的算法和模型。这有助于推动人工智能模型的数学推理能力,推动前沿知识的发
- 人工智能 833 2024-07-12 08:22:13
-
- 揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相
- 在2024年世界人工智能大会的现场,很多人在一个展台前排队,只为让AI大模型给自己在天庭「安排」一个差事。流程:提供个人照片生成仙界形象照(参照《大闹天宫》画风)交互式剧情选择和交谈环节基于选择和回答评估MBTI人格类型根据人格类型"安排"天庭差事体验方式:现场排队在线体验(扫描下方二维码)大模型创业公司阶跃星辰公布大招与上影合作的AI互动体验《AI+大闹天宫》只是阶跃星辰展示大模型魅力的开胃菜。在WAIC期间,他们隆重推出了以下大招:万亿参数MoE大模型:Step-2正式版
- 人工智能 1167 2024-07-12 05:52:58
-
- ACL 2024 | 引领学术视听研究,上海交大、清华大学、剑桥大学、上海AILAB联合发布学术视听数据集M3AV
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者来自上海交通大学,清华大学,剑桥大学和上海人工智能实验室。一作陈哲为上海交通大学博一学生,师从上海交通大学人工智能学院王钰教授。通讯作者为王钰教授(主页:https:/
- 人工智能 1199 2024-07-12 04:11:47
-
- 上交大洪亮课题组&上海AI实验室团队发布FSFP,基于语言模型的蛋白质功能小样本预测方法,登Nature子刊
- 编辑|ScienceAI近日,上海交通大学自然科学研究院/物理天文学院/张江高研院/药学院洪亮教授课题组,联合上海人工智能实验室青年研究员谈攀,在蛋白质突变-性质预测上取得重要突破。该工作采用全新的训练策略,在使用极少湿实验数据的情况下,极大地提高了传统蛋白质预训练大模型在突变-性质预测的效果。该研究成果以《Enhancingtheefficiencyofproteinlanguagemodelswithminimalwet-labdatathroughfew-shotlearning》为题,于
- 人工智能 1049 2024-07-11 20:10:28
-
- 智加科技论文DualBEV入选计算机视觉顶会ECCV
- 近日,智加科技团队论文《DualBEV:UnifyingDualVeiwTransformationwithProbabilisticCorrespondences》入选欧洲计算机视觉国际会议(ECCV,EuropeanConferenceonComputerVision),ECCV是计算机视觉领域最具影响力和权威性的国际会议之一,与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV每两年举办一次,汇聚了全球顶
- 人工智能 614 2024-07-11 18:12:18
-
- 像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了
- 生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍然使用离线学习,因为这与反向传播结合使用时更加简单。那么,人工神经网络是否也能拥有类似于高度可塑性的性质?来自哥本哈根信息技术大学的研究团队提出了一种自组织神经网络——LNDP,能够以活动
- 人工智能 1240 2024-07-11 17:19:10
-
- 分子100%有效,从头设计配体,湖南大学提出基于片段的分子表征框架
- 编辑|KX分子描述符的应用与挑战分子描述符广泛应用于分子建模。然而,在AI辅助分子发现领域,缺乏自然适用、完整且原始的分子表征,影响模型性能和可解释性。t-SMILES框架的提出基于片段的多尺度分子表征框架t-SMILES解决分子表征问题。该框架使用SMILES类型的字符串描述分子,支持序列模型作为生成模型。t-SMILES的代码算法t-SMILES具有三种代码算法:TSSA、TSDY和TSID。实验结果实验表明,t-SMILES模型生成分子具有100%理论有效性和高新颖性,优于基于SOTASM
- 人工智能 646 2024-07-11 16:12:59
-
- 国内首个!商汤科技发布'日日新5o”,实时多模态流式交互对标GPT-4o
- 2024年7月5日,上海——2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC2024)战略合作伙伴商汤科技召开“大爱无疆・向新力”人工智能论坛,发布国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内首个所见即所得模型“日日新5o”带来一种全新的AI交互模式,即实时的流式多模态交互。现场也为大家展示了这
- 人工智能 1129 2024-07-11 15:52:55