社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > 谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

WBOY

发布： 2023-11-17 23:39:01

转载

1126 人浏览过

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

11 月 16 日消息，谷歌公司近日发布新闻稿，介绍了小型人工智能模型 Mirasol，可以回答有关视频的问题并创造新的记录。

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

AI 模型目前很难处理不同的数据流，如果要让 AI 理解视频，需要整合视频、音频和文本等不同模态的信息，这大大增加了难度。

谷歌和谷歌 Deepmind 的研究人员提出了新的方法，将多模态理解扩展到长视频领域。

借助Mirasol AI模型，该团队努力解决两个关键挑战：

需要以高频采样同步视频和音频，但要异步处理标题和视频描述。
视频和音频会生成大量数据，这会让模型的容量紧张。

在Mirasol中，谷歌采用了合路器和自回归转换器模型

该模型组件将处理时间同步的视频和音频信号，然后将视频拆分成独立的片段

转换器处理每个片段，并学习每个片段之间的联系，然后使用另一个转换器处理上下文文本，这两个组件交换有关其各自输入的信息。

一个新的转换模块名为Combiner，能够从每个片段中提取通用表示，并通过降维来压缩数据。每个片段包含4到64帧，该模型目前拥有30亿个参数，能够处理128到512帧的视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

在测试中，Mirasol3B 在视频问题分析方面达到了新的基准，体积明显更小，并且可以处理更长的视频。通过使用带有内存的组合器变体，该团队能够进一步降低所需的计算能力18%

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

本站在此附上 Mirasol 的官方新闻稿，感兴趣的用户可以深入阅读。

以上是谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

人工智能谷歌

来源：51cto.com

上一篇：腾讯云“AI超级底座”专场将亮相WOT大会，技术创新引领AI基础设施新篇章下一篇：谷歌人工智能在快速、准确的天气预报方面击败了超级计算机

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

如何检查坐标是否在 PHP 中的边界对象内？我有一些坐标，我想检查这些坐标是否恰好在谷歌地图范围内（东北和西南）。示例：AvailableLat:40.712776AvailableLong:-74.005974我想知道上面...

来自于 2024-04-05 00:25:54

0

1

1401

尝试了一切方法，但HTML内容仍未显示基本上，html文档的内容不会在浏览器上显示任何内容。我制作的这个HTML文档是从另一个html文件链接的。当我在浏览器上打开这个HTML文件时，它是空白的，当其中有明确的代码时没...

来自于 2024-04-04 19:16:15

0

1

3496

HTML标签<a></a>和<a href=""></a>之间的区别是什么？有些网站在其文本区域中使用[url]网站地址[/url]，并且无法在其中添加锚文本，有人可以向我解释一下吗？我对这个[url][/url]很困惑。我知道html锚标记是如何工作的，...

来自于 2024-04-02 22:46:16

0

2

403

当另一个按钮已聚焦或有焦点内时，如何触发按钮的焦点内状态？查看参考当选择或单击（按钮）库名称时，我希望下一个非活动按钮变为活动状态（变成亮红色）。我用谷歌搜索并发现角度中有一个（模糊）和（焦点）事件

来自于 2024-04-02 16:49:31

0

1

336

如何使用 BeautifulSoup 抓取特定的谷歌天气文本？如何使用BeautifulSoup在Python中找到课程文本“美国纽约市”？尝试复制视频进行练习，但不再有效。尝试在官方文档中找到一些内容，但没有成功。或者我的get_html_...

来自于 2024-04-01 14:06:14

0

1

308

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1426567
php入门教程之一周学会PHP

4274947
JAVA 初级入门视频教程

2566798
小甲鱼零基础入门学习Python视频教程

509276
PHP 零基础入门教程

865541

最新下载

更多>

网站特效

网站源码

网站素材

前端模板