- 方向:
- 全部 网络3.0 后端开发 web前端 数据库 运维 开发工具 php框架 每日编程 微信小程序 常见问题 其他 科技 CMS教程 Java 系统教程 电脑教程 硬件教程 手机教程 软件教程 手游教程
- 分类:
-
- CIO应重点关注的领域,以维持GenAI的势头
- GenAI仍然是大多数企业的首要投资重点,而且期望值很高。根据普华永道的最新调查,美国61%的CEO预期AI将改变他们的业务价值生成方式,但要实现这一目标,企业必须将AI的炒作转化为现实。好消息是,他们在这方面越来越擅长。事实上,根据Databricks最近发布的《数据+AI状态报告》的结果,企业将1342%的模型从实验阶段推向了现实世界,而且他们对数据和AI的雄心并没有减弱,实验模型的数量也增长了134%。这些都是令人鼓舞的迹象,但根据我与CIO和其他技术领导者的对话,当前的挑战是如何保持这一
- 人工智能 971 2024-06-25 18:35:41
-
- 太全了!苹果上新视觉模型4M-21,搞定21种模态
- 当前的多模态和多任务基础模型,如**4M**或**UnifiedIO**,显示出有希望的结果。然而,它们接受不同输入和执行不同任务的开箱即用能力,受到它们接受训练的模态和任务的数量(通常很少)的限制。,基于此,来自洛桑联邦理工学院(EPFL)和苹果的研究者联合开发了一个**先进的**任意到任意模态单一模型,该模型在数十种**广泛**多样化的模态上进行训练,并对大规模多模态数据集和文本语料库进行协同训练。训练过程中一个关键步骤是对各种模态执行离散**tokenization**,无论它们是类似图像
- 人工智能 1113 2024-06-25 17:17:19
-
- 营销效果大幅提升,AIGC视频创作就该这么用
- 经过一年多的发展,AIGC已经从文字对话、图片生成逐步向视频生成迈进。回想四个月前,Sora的诞生让视频生成赛道经历了一场洗牌,大力推动了AIGC在视频创作领域的应用范围和深度。在人人都在谈论大模型的时代,我们一方面惊讶于视频生成带来的视觉震撼,另一方面又面临着落地难问题。诚然,大模型从技术研发到应用实践还处于一个磨合期,仍需结合实际业务场景进行调优,但理想与现实的距离正在被逐步缩小。营销作为人工智能技术的重要落地场景,成为了很多企业及从业者想要突破的方向。掌握了恰当方法,营销视频的创作过程就会
- 人工智能 331 2024-06-25 00:01:11
-
- AI小分子药物发现的「百科全书」,康奈尔、剑桥、EPFL等研究者综述登Nature子刊
- 作者|康奈尔大学杜沅岂编辑|ScienceAI随着AIforScience受到越来越多的关注,人们更加关心AI如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。AI与小分子药物发现是其中一个非常有代表性和很早被探索的领域。分子发现是一个非常困难的组合优化问题(由于分子结构的离散性)并且搜索空间非常庞大与崎岖,同时验证搜索到的分子属性又十分困难,通常需要昂贵的实验,至少是至少是模拟计算、量子化学的方法来提供反馈。随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果衡
- 人工智能 494 2024-06-24 21:20:21
-
- 奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室(GAIRLab)的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthr
- 人工智能 1065 2024-06-24 17:01:06
-
- 从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RL
- 人工智能 611 2024-06-24 15:04:43
-
- 为什么都放弃了LangChain?
- 或许从诞生那天起,LangChain就注定是一个口碑两极分化的产品。看好LangChain的人欣赏它丰富的工具和组建和易于集成等特点,不看好LangChain的人,认为它注定失败——在这个技术变化如此之快的年代,用LangChain来构建一切根本行不通。夸张点的还有:「在我的咨询工作中,我花了70%的精力来说服人们不要使用langchain或llamaindex。这解决了他们90%的问题。」最近,一篇LangChain吐槽文再次成为热议焦点:作者FabianBoth是AI测试工具O
- 人工智能 1041 2024-06-24 14:20:32
-
- ICML 2024 | 特征污染:神经网络会学习不相关特征而泛化失败
- 论文标题:FeatureContamination:NeuralNetworksLearnUncorrelatedFeaturesandFailtoGeneralize论文链接:https://arxiv.org/pdf/2406.03345代码链接:https://github.com/trzhang0116/feature-contamination随着以GPT为代表的大模型在近年来取得的巨大成功,深度神经网络+SGD+scaling的机器学习范式再次证明了其在AI领域的主导地位。为什么基于
- 人工智能 845 2024-06-24 14:17:11
-
- CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为SergeBelongie。他硕士毕业于苏黎世联邦理工学院(ETHZurich),在硕士期间,他在导师LucVan
- 人工智能 846 2024-06-24 14:05:51
-
- 字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在生成式模型的迅速发展中,ImageTokenization扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Toke
- 人工智能 1081 2024-06-24 14:03:31
-
- 华为云用盘古大模型重塑服务,ModelArts Studio全面升级
- 华为开发者大会2024在东莞召开。在大会现场,华为发布了HarmonyOSNext、盘古大模型5.0等方面的最新进展,并介绍了一系列AI先进技术的应用案例。华为云CTO张宇昕表示:“华为云基于盘古大模型的能力,重塑一系列的云服务,打造AINative的云,助力千行万业智能化。”据介绍,华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全
- 人工智能 359 2024-06-22 11:55:38
-
- 一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
- 机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude3.5能力真那么玄乎?它来了,它来了,它带着Claude3.5Sonnet走来了!蛰伏三个月,就在昨晚,OpenAI的「劲敌」Anthropic上新了,推出新一代模型——Claude3.5Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解
- 人工智能 1086 2024-06-22 07:46:19
-
- 涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型
- 作者|香港中文大学白帆编辑|ScienceAI近日,香港中文大学和智源联合提出的M3D系列工作,包括M3D-Data,M3D-LaMed和M3D-Bench,从数据集、模型和测评全方面推动3D医学图像分析的发展。(1)M3D-Data是目前最大的3D医学图像数据集,包括M3D-Cap(120K3D图文对),M3D-VQA(510K问答对),M3D-Seg(150K3DMask),M3D-RefSeg(3K推理分割)共四个子数据集。(2)M3D-LaMed是目前最多功能的3D医学多模态大模型,能够
- 人工智能 669 2024-06-22 07:16:49
-
- 无论真实还是AI视频,「摩斯卡」都能重建恢复4D动态可渲染场景
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com雷嘉晖,美国宾夕法尼亚大学计算机系博士生(2020-今),导师为KostasDaniilidis教授,目前主要研究方向为四维动态场景几何的建模表示和算法以及应用。他在计算机视觉
- 人工智能 708 2024-06-22 07:09:52
-
- 自动识别最佳分子,降低合成成本,MIT开发分子设计决策算法框架
- 编辑|紫罗AI在简化药物发现方面的应用正在爆炸式增长。从数十亿种候选分子中筛选出可能具有开发新药所需特性的分子。需要考虑的变量太多了,从材料价格到出错的风险,即使科学家使用AI,权衡合成最佳候选分子的成本也不是一件容易的事。在此,MIT研究人员开发了一个定量决策算法框架SPARROW,来自动识别最佳分子候选物,从而最大限度地降低合成成本,同时最大限度地提高候选物具有所需特性的可能性。该算法还确定了合成这些分子所需的材料和实验步骤。SPARROW考虑了一次合成一批分子的成本,因为多个候选分子通常可
- 人工智能 1060 2024-06-22 06:43:34