当前位置:首页 > 技术文章 > 科技周边 > 人工智能

  • CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
    CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
    循环调用CLIP,无需额外训练就有效分割无数概念。包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。牛津大学与谷歌研究院联合团队的这项新成果,已被CVPR2024接收,并开源了代码。团队提出名为CLIPasRNN(简称CaR)的新技术,解决了开放词汇量图像分割领域中的几个关键问题:无需训练数据:传统方法需要大量的掩膜注释或图像-文本数据集进行微调,CaR技术则无需任何额外的训练数据即可工作。开放词汇量的限制:预训练的视觉-语言模型(VLMs)在经过微调后,其处理开放词汇量的能力受到限制。C
    人工智能 529 2024-06-09 12:53:28
  • 支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate
    支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate
    AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com人类跳舞视频生成是一项引人注目且具有挑战性的可控视频合成任务,旨在根据输入的参考图像和目标姿势序列生成高质量逼真的连续视频。随着视频生成技术的快速发展,特别是生成模型的迭代演化
    人工智能 1120 2024-06-09 11:10:58
  • 比PID更丝滑的控制算法&卡内基梅隆大学
    比PID更丝滑的控制算法&卡内基梅隆大学
    MPC控制算法,全称ModelPredictiveControl(模型预测控制),是一种基于系统动态模型的控制技术。它的工作原理是通过数学模型预测系统的未来行为,并基于这些预测结果来优化系统的控制输入,从而实现期望的输出。MPC控制算法的核心思想是在每个控制周期内,通过对未来一段时间内的预测结果进行优化,以获得最佳的控制输入。这种优化是基于一些预测结果来优化系统的控制输入,从而实现期望的输出。MPC控制算法的应用非常广泛,特别适用于需要满足一些约束条件的控制系统。通过结合系统模型和优化技术,MP
    人工智能 880 2024-06-09 09:57:28
  • 套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
    套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
    斯坦福团队抄袭清华系大模型事件后续来了——Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文,由SiddharthSharma(悉达多)和AkshGarg(阿克什)发出。不在其中、来自南加利福尼亚大学的MustafaAljadery(简称老穆)被指是主要过错方,并且自昨天起人就失踪了:我们希望由老穆首发声明,但自昨天以来一直无法联系到他。悉达多、我(阿克什)和老穆一起发布了Llama3-V,老穆为该项目编写了代码。悉达多和我的角色是帮助他在Medium和T
    人工智能 1352 2024-06-09 09:38:08
  • 又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
    又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
    前言该模型结合了SigLIP视觉模型和Gemma语言模型,这两种模型都是开放组件,使得PaliGemma在处理视觉与语言结合的任务上表现出色。PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemma的能力来理解图像内容并提取关键特征,然后将这些信息转化为语言输出,从而实现与用户的交互或自动化内容生成。这种灵活性使得PaliGemma不仅适用于研究和开发环境,也适合商业应用,如客户服务、内容推荐系统等。图片PaliGemma能干什么图片可以在出现提示时为
    人工智能 685 2024-06-09 09:17:06
  • LightGBM实战+随机搜索调参:准确率96.67%
    LightGBM实战+随机搜索调参:准确率96.67%
    大家好,我是Peter~LightGBM是一种经典的机器学习算法,它的背景、原理和特点都非常值得研究。LightGBM的算法产生了一些特点,例如高效、可扩展和高准确性。本文将简要介绍LightGBM的特点、原理以及一些基于LightGBM和随机搜索优化的案例。LightGBM算法在机器学习领域,梯度提升机(GradientBoostingMachines,GBMs)是一类强大的集成学习算法,它们通过逐步添加弱学习器(通常是决策树)来最小化预测误差,从而构建一个强大的模型。GBMs通常用于最小化预
    人工智能 782 2024-06-08 22:45:30
  • Mistral 开源代码模型夺得王座!Codestral疯狂训练超80种语言,国内通义开发者请求出战!
    Mistral 开源代码模型夺得王座!Codestral疯狂训练超80种语言,国内通义开发者请求出战!
    出品|51CTO技术栈(微信号:blog51cto)Mistral发布了首个代码模型Codestral-22B!该模型的疯狂之处不仅在于训练了80多种编程语言,包括许多代码模型忽略的Swift等。他们的速度没有完全一致。要求使用Go语言编写一个“发布/订阅”系统。这里的GPT-4o正在输出,Codestral已经快到看不清的速度交卷了!由于该模型刚刚推出,尚未公开测试。但根据Mistral的负责人说法,Codestral是目前表现最佳的开源代码模型。图片感兴趣的朋友可以移步:-抱抱脸:https
    人工智能 1278 2024-06-08 21:55:01
  • 迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
    迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
    中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多模态理解和常识推理能力,进行从场景理解到横向和纵向运动指令生成的层次化推理,并进一步产生规划器所需的指令。在大规模且具有挑战性的nuPlan基准上对该方法进行了测试,实验表明PlanAgent在常规场景和长尾场景上都取得了最好(SOTA)性能。与常规大语言模型(LLM)方法相比,PlanAgent所
    人工智能 511 2024-06-08 21:30:27
  • 模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了
    模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了
    TinyLLaVA+项目由清华大学电子系多媒体信号与智能信息处理实验室(MSIIP)吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学MSIIP实验室长期致力于智能医疗、自然语言处理与知识发现、多模态等研究领域。北京航空团队长期致力于深度学习、多模态、计算机视觉等研究领域。TinyLLaVA+项目的目标是开发一种小型跨语言智能助手,具备语言理解、问答、对话等多模态能力。项目团队将充分发挥各自的优势,共同攻克技术难题,实现智能助手的设计与开发。这将为智能医疗、自然语言处理与知
    人工智能 594 2024-06-08 21:21:29
  • 美国机器人应用遥遥落后?时隔15年,十所顶尖高校重启「国家机器人路线图」
    美国机器人应用遥遥落后?时隔15年,十所顶尖高校重启「国家机器人路线图」
    机器人技术已经有70年的历史了,从诞生之初就一直由美国领跑。截至2009年,美国首次发布国家机器人路线图(NationalRoboticsRoadmap),美国在工业应用领域(如汽车、航空航天和家电等)的应用已经降低到了全球第四位。自15年以后,美国在机器人技术的采用量上持续拉胯,位列全球第十,其中亚洲的机器人市场更是扩大了美国市场的5-10倍。中国则在此领域“遥遥领先”,2023年,中国大约购买了52%的销出机器人,表明机器人技术在美国已经不再是国家级的优先事项。最近,来自加州大学、宾夕法尼亚
    人工智能 1142 2024-06-08 20:57:00
  • MIT最新力作:用GPT-3.5解决时间序列异常检测问题
    MIT最新力作:用GPT-3.5解决时间序列异常检测问题
    今天给大家介绍一篇MIT上周发表的文章,使用GPT-3.5-turbo解决时间序列异常检测问题,初步验证了LLM在时间序列异常检测中的有效性。整个过程没有进行finetune,直接使用GPT-3.5-turbo进行异常检测,文中的核心是如何将时间序列转换成GPT-3.5-turbo可识别的输入,以及如何设计prompt或者pipeline让LLM解决异常检测任务。下面给大家详细介绍一下这篇工作。图片论文标题:Largelanguagemodelscanbezero-shotanomalydete
    人工智能 747 2024-06-08 18:09:01
  • 微软Build大会上,Fabric、PostgreSQL和Cosmos DB获AI增强功能
    微软Build大会上,Fabric、PostgreSQL和Cosmos DB获AI增强功能
    微软近日在Build大会上发布了约60项公告,其中包括云数据库管理产品新的人工智能功能。该公司去年推出的统一数据平台Fabric是一个主要受益者。一个目前处于预览阶段的工作负载开发工具包(WorkloadDevelopmentKit)可用于扩展Fabric中的应用。FabricDataSharing是一项新功能,可跨用户和应用程序处理实时数据。它包括一个应用程序接口,用于访问存储在外部源中的数据。新的自动化功能(Automation)可简化重复性任务。整个系统Fusion是一种全新的RESTfu
    人工智能 1111 2024-06-08 17:46:24
  • 加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
    加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
    写在前面&笔者的个人理解为了在复杂的真实世界场景中安全导航,自动驾驶汽车必须能够够适应各种道路条件并预测未来事件。基于世界模型的强化学习(RL)已经成为一种有前景的方法,通过学习和预测各种环境的复杂动态来实现这一点。然而,目前并不存在一个用于在复杂驾驶环境中训练和测试此类算法的易于接近的平台。为了填补这一空白,这里介绍了CarDreamer,第一个专为开发和评估基于世界模型的自动驾驶算法设计的开源学习平台。它包含三个关键组成部分:1%)世界模型(WM)主干:CarDreamer整合了一些
    人工智能 1250 2024-06-08 16:57:52
  • 2024智源大会议程公开丨生成模型
    2024智源大会议程公开丨生成模型
    2024年6月14日-15日,第6届北京智源大会将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。北京智源大会倒计时:11天生成模型论坛丨6月15日下午生成功能建模是人工智能的基础范式之一,是迈向通用人工智能的重要一环。随着生成式建模方法的快速发展和模型规模的急速增长,以自回归模型、扩散概率模型为代表的生成式人工智能(如GPT系列、Sora、StableD
    人工智能 690 2024-06-08 16:08:31
  • AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
    AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
    上周,在内部的离职潮和外部的口诛笔伐之下,OpenAI可谓是内忧外患:-侵权寡姐引发全球热议-员工签署「霸王条款」被接连曝出-网友细数奥特曼「七宗罪」辟谣:根据Vox获取的泄露信息和文件,OpenAI的高级领导层,包括Altman在内,非常了解这些股权回收条款,并且签署了它们。除此之外,还有一个严峻而紧迫的问题摆在OpenAI面前——AI安全。最近,五名与安全相关的员工离职,其中包括两名最著名的员工,“超级对齐”团队的解散让OpenAI的安全问题再次被置于聚光灯下。《财富》杂志报道称,OpenA
    人工智能 1178 2024-06-08 13:00:10

工具推荐

jQuery企业留言表单联系代码

jQuery企业留言表单联系代码是一款简洁实用的企业留言表单和联系我们介绍页面代码。
表单按钮
2024-02-29

HTML5 MP3音乐盒播放特效

HTML5 MP3音乐盒播放特效是一款基于html5+css3制作可爱的音乐盒表情,点击开关按钮mp3音乐播放器。
播放器特效
2024-02-29

HTML5炫酷粒子动画导航菜单特效

HTML5炫酷粒子动画导航菜单特效是一款导航菜单采用鼠标悬停变色的特效。
菜单导航
2024-02-29

jQuery可视化表单拖拽编辑代码

jQuery可视化表单拖拽编辑代码是一款基于jQuery和bootstrap框架制作可视化表单。
表单按钮
2024-02-29

有机果蔬供应商网页模板 Bootstrap5

一款有机果蔬供应商网页模板-Bootstrap5
Bootstrap模板
2023-02-03

Bootstrap3多功能数据信息后台管理响应式网页模板-Novus

Bootstrap3多功能数据信息后台管理响应式网页模板-Novus
后端模板
2023-02-02

房产资源服务平台网页模板 Bootstrap5

房产资源服务平台网页模板 Bootstrap5
Bootstrap模板
2023-02-02

简约简历资料网页模板 Bootstrap4

简约简历资料网页模板 Bootstrap4
Bootstrap模板
2023-02-02

可爱的夏天元素矢量素材(EPS+PNG)

这是一款可爱的夏天元素矢量素材,包含了太阳、遮阳帽、椰子树、比基尼、飞机、西瓜、冰淇淋、雪糕、冷饮、游泳圈、人字拖、菠萝、海螺、贝壳、海星、螃蟹、柠檬、防晒霜、太阳镜等等,素材提供了 EPS 和免扣 PNG 两种格式,含 JPG 预览图。
PNG素材
2024-05-09

四个红的的 2023 毕业徽章矢量素材(AI+EPS+PNG)

这是一款红的的 2023 毕业徽章矢量素材,共四个,提供了 AI 和 EPS 和免扣 PNG 等格式,含 JPG 预览图。
PNG素材
2024-02-29

唱歌的小鸟和装满花朵的推车设计春天banner矢量素材(AI+EPS)

这是一款由唱歌的小鸟和装满花朵的推车设计的春天 banner 矢量素材,提供了 AI 和 EPS 两种格式,含 JPG 预览图。
banner图
2024-02-29

金色的毕业帽矢量素材(EPS+PNG)

这是一款金色的毕业帽矢量素材,提供了 EPS 和免扣 PNG 两种格式,含 JPG 预览图。
PNG素材
2024-02-27

家居装潢清洁维修服务公司网站模板

家居装潢清洁维修服务公司网站模板是一款适合提供家居装潢、清洁、维修等服务机构宣传网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
前端模板
2024-05-09

清新配色个人求职简历引导页模板

清新配色个人求职简历引导页模板是一款适合清新配色风格的个人求职简历作品展示引导页网页模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
前端模板
2024-02-29

设计师创意求职简历网页模板

设计师创意求职简历网页模板是一款适合各种不同设计师岗位个人求职简历展示网页模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
前端模板
2024-02-28

现代工程建筑公司网站模板

现代工程建筑公司网站模板是一款适合从事工程建筑服务行业宣传网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
前端模板
2024-02-28