第 64 页-探索人工智能技术的未来

当前位置：首页 > 技术文章 > 科技周边 > 人工智能

方向：: 全部网络3.0 后端开发 web前端数据库运维开发工具 php框架每日编程微信小程序常见问题其他科技 CMS教程 Java 系统教程电脑教程硬件教程手机教程软件教程手游教程

分类：: 人工智能 IT业界

最热

最新

击败Gemini-1.5-Pro、GPT-4V，从容大模型多模态能力跻身全球前三

近日，云从科技从容大模型在综合评测权威平台OpenCompass的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-Sonnet（67.9）。而在国内市场，从容大模型的成绩也超过了InternVL-Chat（61.7）和GLM-4V（60.8），排名首位。1.OpenCompass多模态榜单OpenCom

人工智能 1053 2024-06-29 00:25:01
Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文作者张天宇，就读于加拿大Mila人工智能研究所，师从图灵奖得主YoshuaBengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变

人工智能 852 2024-06-29 00:06:53
字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型

近日，苹果公司在HuggingFace上发布了20个新的CoreML模型和4个数据集，字节大模型团队的单目深度估计模型DepthAnythingV2入选其中。 CoreML苹果公司的机器学习框架，用于将机器学习模型集成到iOS、MacOS等设备上高效运行。在无需互联网连接的情况下执行复杂的AI任务，增强用户隐私并减少延迟。苹果开发者可通过这些模型构建智能、安全的AI应用。 DepthAnythingV2字节大模型团队开发的单目深度估计模型。 V2版细节处理更精细，鲁棒性更强，速度显着提升。包含25M到

人工智能 528 2024-06-28 22:40:06
将图像自动文本化，图像描述质量更高、更准确了

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com皮仁杰：香港科技大学博士三年级学生，师从张潼教授和周晓方教授。于2024年获得苹果奖学金。目前主要研究方向是多模态大语言模型和数据为中心的AI。张鉴殊：武汉大学本科三年级学生，

人工智能 971 2024-06-28 21:41:35
寒武纪1号诞生：谢赛宁Yann LeCun团队发布最强开源多模态LLM

就像动物有了眼睛，谢赛宁YannLeCun团队的Cambrian-1能让AI获得强大的视觉表征学习能力。古往今来，许多哲学家都探究过这个问题：理解语言的含义是否需要以感官为基础？尽管哲学家们看法不一，但有一点却不言而喻：坚实有效的感官定基（grounding）至少能带来助益。比如科学家们普遍相信，寒武纪大爆发期间视觉的出现是早期动物演化的关键一步；这不仅能帮助动物更好地找寻食物和躲避捕食者，而且还有助于动物自身的进化。事实上，人类（以及几乎所有动物）的大多数知识都是通过与物理交互的感官体验获取的

人工智能 1304 2024-06-28 21:28:07
国产大模型新高度！讯飞星火4.0发布：整体超越GPT-4 Turbo，8个国际权威测试集测评第一

国内大模型的能力，又来到了一个新高度！6月27日，科大讯飞正式对外发布讯飞星火大模型V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。随着新版本的发布，讯飞星火V4.0七大核心能力全面升级，在8个国际主流测试集中排名第一，整体超越GPT-4Turbo，领先国内大模型。刘庆峰称，当前，星火APP下载量已经达到了1.31亿，涌现出一批用户喜爱的应用助手。在星火大模型的加持下，部分场景下的智能硬件销量同比增长70%+，月均使用时次数超过4000万。另外，星火V4.0大模型是基于全国首个国产万卡

人工智能 1135 2024-06-28 20:52:47
史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

DiT都能用，生成视频无质量损失，也不需要训练。实时AI视频生成来了！本周三，新加坡国立大学尤洋团队提出了业内第一种可以实时输出的，基于DiT的视频生成方法。该技术名为PyramidAttentionBroadcast（PAB）。通过减少冗余注意力计算，PAB实现了高达21.6FPS的帧率和10.6倍的加速，同时不会牺牲包括Open-Sora、Open-Sora-Plan和Latte在内的流行基于DiT的视频生成模型的质量。值得注意的是，作为一种不需要训练的方法，PAB可以为任何未来基于DiT的

人工智能 1437 2024-06-28 19:14:46
清华AIR等提出ESM-AA，首个从氨基酸到原子尺度的蛋白质语言模型

来自清华大学AIR、北京大学、南京大学的研究团队提出了ESM-AA模型。该模型在蛋白质语言建模领域取得了重要进展，提供了一套整合多尺度信息的统一建模方案。它是首个能同时处理氨基酸信息和原子信息的蛋白质预训练语言模型。模型的出色性能展示了多尺度统一建模在克服现有局限和解锁新能力方面的巨大潜力。作为基座模型，ESM-AA获得了多位学者的关注与广泛讨论（截图见下方），被认为有潜力基于ESM-AA开发出可与AlphaFold3、RoseTTAFoldAll-Atom相竞争的模型，为研究不同生物结构间的相

人工智能 1323 2024-06-28 18:10:06
高效且准确，郑州大学团队开发新AI工具识别药物-靶标相互作用

编辑|枯叶蝶准确识别药物-靶标相互作用（DTI）是药物发现和药物重新定位过程中的关键步骤之一。目前，许多基于计算的模型已被提出，用于预测DTI，并取得了一些显着的进步。然而，这些方法很少关注如何以适当的方式融合与药物和靶标相关的多视角相似性网络。此外，如何充分结合已知的相互作用关系来准确表示药物和靶标尚未得到很好的研究。因此，提高DTI预测模型的准确性仍然是必要的。在最新的研究中，郑州大学、电子科技大学团队提出了一种新方法MIDTI。该方法采用多视图相似性网络融合策略和深度交互式注意机制来预测药

人工智能 1210 2024-06-28 02:31:25
专为五大科学领域定制，NASA与IBM合作开大语言模型INDUS

INDUS以南天星座命名，是一套全面的大型语言模型，支持五个科学领域。（来源：NASA）编辑|KX在大量数据上训练的大型语言模型(LLM)在自然语言理解和生成任务上表现出色。大多数流行的LLM使用Wikipedia等通用语料库进行训练，但词汇的分布变化导致特定领域的性能不佳。受此启发，NASA与IBM合作开发了INDUS，这是一套全面的LLM，专为地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学领域量身定制，并使用从不同数据源的精选科学语料库进行训练。INDUS包含两类模型：编码器和句

人工智能 928 2024-06-27 20:28:32
OpenAI 突然断供中国！商汤推出0成本'搬家服务”，还送大礼包

6月25日，商汤科技宣布推出超值大模型0元购计划，即日起成为商汤“日日新SenseNova”新注册企业用户，将获得涉及调用、迁徙、训练等多项免费服务大礼包，0元GO！“日日新SenseNova”平台覆盖商量大语言模型、商量图文多模态大模型、秒画文生图大模型、语音大模型、向量模型等多类模型API接口，满足企业用户不同需求。商汤始终坚持AI原创，技术安全且自主可控，并自有商汤大装置SenseCore这类先进、低成本、规模化的新一代AI基础设施，算力有保障。商汤将

人工智能 575 2024-06-27 00:23:50
模拟5亿年的进化信息，首个同时推理蛋白质序列、结构和功能的生物学大模型

编辑|萝卜皮在**漫长**的三十亿年的自然进化历程中，**现存**蛋白质的**形态**得以形成，经历了漫长的自然筛选过程。进化如同在地质时间尺度上进行的平行实验，通过随机突变和选择机制，依据蛋白质的序列、结构与功能进行筛选。,在这里，EvolutionaryScale的研究人员展示了在**进化产生的**标记上训练的语言模型可以充当**进化模拟器**，用于生成不同于已知蛋白质序列的**功能性**蛋白质。,研究人员提出了**尖端的**ESM3，这是一种**先进**的多模态生成语言模型，可推理蛋白质的

人工智能 1092 2024-06-26 20:40:11
耳朵没错，是声音太真了，字节豆包语音合成成果Seed-TTS技术揭秘

Seed-TTS是字节跳动豆包大模型团队近期发布的语音生成大模型成果。,它生成的语音几乎与真人**无异**，连发音**缺陷**也能生成出来，尤其在学习模仿人类说话方面，**逼真度**和**流畅度**均有**出色**表现。举例来说，将一段语音提供给Seed-TTS，它就能按文本生成全新语音，且带上原素材的声音特征。原素材（Prompt）：Seed-TTS生成的中文语音：突然，身边一阵笑声。我看着他们，意气风发地挺直了胸膛，甩了甩那稍显肉感的双臂，轻笑道：“我身上的肉，是为了掩饰我爆棚的魅力，否则

人工智能 1188 2024-06-26 20:37:12
网易伏羲将携创新成果亮相WAIC 2024，精彩亮点抢先看！

2024世界人工智能大会暨人工智能全球治理高级别会议（简称“WAIC 2024”）将于7月4日在上海开幕。作为国内人工智能领域的领军者，网易伏羲将携旗下核心产品——网易瑶台、网易灵动、有灵平台、丹青约、游戏AI齐齐亮相WAIC 2024，全面展示自身在人工智能领域的尖端技术与应用成果。1、网易瑶台VR大空间：行业首秀，重构沉浸式体验新空间在WAIC 2024网易伏羲展位上，网易瑶台将展示行业首个企业VR大空间，震撼呈现企业VR“**无穷**”展厅概念。在仅20平米的场地空间中，实现多层展厅扩展、

人工智能 510 2024-06-26 18:42:22
美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

5月30日，国际人工智能顶会CVPR2024举办的第3届野外像素级视频理解挑战赛（The3rdPixel-levelVideoUnderstandingintheWild,PVUW。下文简称PVUW）公布赛事结果，美图影像研究院（MTLab）再获殊荣，斩获视频语义分割（VSS）、复杂场景视频目标分割（MOSE）双赛道亚军，视频全景分割挑战赛（VPS）赛道季军，这也是美图影像研究院（MTLab）第3次在CVPR大会上摘得奖项，共获得了1金3银3铜的杰出成绩。作为全球范围内计算机视觉领域的顶尖盛会，

人工智能 886 2024-06-26 17:13:20