谷歌Gemini1.5火速上线：MoE架构，100万上下文-人工智能-PHP中文网

首页

科技周边

人工智能

谷歌Gemini1.5火速上线：MoE架构，100万上下文

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 16, 2024 pm 06:50 PM

谷歌产业 gemini

今天，谷歌宣布推出 Gemini 1.5。

Gemini 1.5是在谷歌基础模型和基础设施的研究与工程创新基础上开发的。这个版本引入了新的专家混合（MoE）架构，以提高Gemini 1.5的训练和服务的效率。

谷歌推出的是用于早期测试的Gemini 1.5的第一个版本，即Gemini 1.5 Pro。它是一种中型多模态模型，主要针对多种任务进行了扩展优化。与谷歌最大的模型1.0 Ultra相比，Gemini 1.5 Pro的性能水平相似，并引入了突破性的实验特征，能够更好地理解长上下文。

Gemini 1.5 Pro的token上下文窗口数量为128,000个。然而，谷歌从今天开始，为少数开发人员和企业客户提供了AI Studio和Vertex AI的私人预览版，允许他们在最多1,000,000个token的上下文窗口中进行尝试。此外，谷歌还进行了一些优化，旨在改善延迟、减少计算要求并提升用户体验。

谷歌 CEO Sundar Pichai 和谷歌 DeepMind CEO Demis Hassabis 对新模型进行了专门介绍。

^{领先基础模型的上下文长度}

高效架构

Gemini 1.5 建立在谷歌对 Transformer 和 MoE 架构的领先研究之上。传统 Transformer 充当一个大型神经网络，而 MoE 模型则分为更小的 “专家” 神经网络。

根据给定输入的类型，MoE 模型学会选择性地仅激活其神经网络中最相关的专家路径。这种专业化极大地提高了模型的效率。通过稀疏门控 MoE、GShard-Transformer、Switch-Transformer、M4 等研究，Google 一直是深度学习 MoE 技术的早期采用者和先驱。

谷歌在模型架构方面的最新创新使 Gemini 1.5 能够更快地学习复杂任务并保持质量，同时更高效地训练和服务。这些效率正在帮助谷歌团队比以往更快地迭代、培训和交付更高级的 Gemini 版本，并且正在努力进一步优化。

更长的上下文，更有用的功能

人工智能模型的 “上下文窗口” 由 token 组成，token 是用于处理信息的构建块。token 可以是文字、图像、视频、音频或代码的整个部分或子部分。模型的上下文窗口越大，它在给定提示中可以接收和处理的信息就越多，从而使其输出更加一致、相关和有用。

通过一系列机器学习创新，谷歌增加了 1.5 Pro 的上下文窗口容量，远远超出了 Gemini 1.0 最初的 32,000 个 token。该大模型现在可以在生产环境中运行多达 100 万个 token。

这意味着 1.5 Pro 可以一次性处理大量信息，包括 1 小时的视频、11 小时的音频、超过 30,000 行代码或超过 700,000 个单词的代码库。在谷歌的研究中，还成功测试了多达 1000 万个 token。

对大量信息进行复杂推理

1.5 Pro 可以在给定提示内无缝分析、分类和总结大量内容。例如，当给出阿波罗 11 号登月任务的 402 页记录时，它可以推理整个文档中的对话、事件和细节。谷歌Gemini1.5火速上线：MoE架构，100万上下文

^{Gemini 1.5 Pro 可以理解、推理和识别阿波罗 11 号登月任务的 402 页记录中的好奇细节。}

更好地理解和推理跨模态

1.5 Pro 可以针对包括视频在内的不同模式执行高度复杂的理解和推理任务。例如，当给定一部 44 分钟的巴斯特・基顿无声电影时，该模型可以准确分析各种情节点和事件，甚至推理出电影中容易被忽略的小细节。

Gemini 1.5 Pro 可以理解、推理和识别阿波罗 11 号登月任务的 402 页记录中的好奇细节。

更好地理解和推理跨模态

Gemini 1.5 Pro 可以理解、推理和识别阿波罗 11 号登月任务的 402 页记录中的好奇细节。

更好地理解和推理跨模态

1.5 Pro 可以针对包括视频在内的不同模式执行高度复杂的理解和推理任务。例如，当给定一部 44 分钟的巴斯特・基顿无声电影时，该模型可以准确分析各种情节点和事件，甚至推理出电影中容易被忽略的小细节。谷歌Gemini1.5火速上线：MoE架构，100万上下文

当给出简单的线条图作为现实生活中物体的参考材料时，Gemini 1.5 Pro 可以识别 44 分钟的巴斯特基顿无声电影中的场景。

使用较长的代码块解决相关问题

1.5 Pro 可以跨较长的代码块执行更相关的问题解决任务。当给出超过 100,000 行代码的提示时，它可以更好地推理示例、建议有用的修改并解释代码不同部分的工作原理。谷歌Gemini1.5火速上线：MoE架构，100万上下文

^{Gemini 1.5 Pro 可以推理 100,000 行代码，提供有用的解决方案、修改和注释}

增强性能

在文本、代码、图像、音频、视频评估综合面板上进行测试时，1.5 Pro 在用于开发大型语言模型 (LLM) 的基准测试中，87% 的性能优于 1.0 Pro。在相同的基准测试中与 1.0 Ultra 相比，它的表现大致相似。

即使上下文窗口增加，Gemini 1.5 Pro 仍能保持高水平的性能。

在 NIAH 评估中，故意将包含特定事实或陈述的一小段文本放置在很长的文本块中，1.5 Pro 99% 的时间都能找到嵌入的文本，在数据块中如下只要 100 万个 token。

Gemini 1.5 Pro 还展示了令人印象深刻的 “上下文学习（in-context learning）” 技能，这意味着它可以从长提示中给出的信息中学习新技能，而不需要额外的微调。谷歌在 MTOB （Translation from One Book ）基准测试中测试了这项技能，该基准显示了该模型从以前从未见过的信息中学习的能力。当给定卡拉芒语（一种全球使用人数不足 200 人的语言）的语法手册时，该模型可以学习将英语翻译成卡拉芒语，其水平与学习相同内容的人相似。

由于 1.5 Pro 的长上下文窗口是大型模型中的首创，因此谷歌正在不断开发新的评估和基准来测试其新颖的功能。

有关更多详细信息，请参阅 Gemini 1.5 Pro 技术报告。

技术报告地址：https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf

使用 Gemini 模型进行构建和实验

谷歌致力于负责任地将每个新一代 Gemini 模型带给全球数十亿人、开发者和企业用户使用。

从今天开始，谷歌将通过 AI Studio 和 Vertex AI 向开发者和企业客户提供 1.5 Pro 预览版。

未来，当模型进行更广泛的发布时，届时，谷歌将推出具有标准 128,000 个 token 上下文窗口的 1.5 Pro。很快，随着谷歌对模型的改进，谷歌计划引入从标准 128,000 个上下文窗口开始并扩展到 100 万个 token 的定价等级。

早期测试人员可以在测试期间免费尝试 100 万个 token 上下文窗口，速度的显着提高也即将到来。

有兴趣测试 1.5 Pro 的开发人员现在可以在 AI Studio 中注册，而企业客户可以联系他们的 Vertex AI 客户团队。

^{参考链接：https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#sundar-note}

以上是谷歌Gemini1.5火速上线：MoE架构，100万上下文的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7489

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

2025币圈交易所平台哪个好十大热门货币交易app最新推荐 Mar 25, 2025 pm 06:18 PM

2025币圈交易所平台排名：1. OKX，2. Binance，3. Gate.io，4. Coinbase，5. Kraken，6. Huobi Global，7. Crypto.com，8. KuCoin，9. Gemini，10. Bitstamp。这些平台在安全措施、用户评价和市场表现方面表现优异，适合用户选择进行数字货币交易。

欧易okex账号怎么注册、使用、注销教程 Mar 31, 2025 pm 04:21 PM

本文详细介绍了欧易OKEx账号的注册、使用和注销流程。注册需下载APP，输入手机号或邮箱注册，完成实名认证。使用方面涵盖登录、充值提现、交易以及安全设置等操作步骤。而注销账号则需要联系欧易OKEx客服，提供必要信息并等待处理，最终获得账号注销确认。通过本文，用户可以轻松掌握欧易OKEx账号的完整生命周期管理，安全便捷地进行数字资产交易。

2025年安全好用的虚拟币交易平台榜单汇总 Mar 25, 2025 pm 06:15 PM

2025年安全好用的虚拟币交易平台推荐，本文汇总了Binance、OKX、火币、Gate.io、Coinbase、Kraken、KuCoin、Bitfinex、Crypto.com和Gemini等十个全球主流虚拟货币交易平台。它们在交易对数量、24小时成交额、安全性、用户体验等方面各有优势，例如Binance交易速度快，OKX期货交易热门，Coinbase适合新手，Kraken则以安全性着称。但需注意，虚拟货币交易风险极高，投资需谨慎，中国大陆地区不受法律保护。选择平台前请务必仔细评估自身风

2025数字货币交易所APP哪个好十大虚拟币app交易所排行 Mar 25, 2025 pm 06:06 PM

2025年安全的数字货币App交易所排名：1. OKX，2. Binance，3. Gate.io，4. Coinbase，5. Kraken，6. Huobi Global，7. Crypto.com，8. KuCoin，9. Gemini，10. Bitstamp。这些平台在安全措施、用户评价和市场表现方面表现优异，适合用户选择进行数字货币交易。

以太坊正规交易平台最新汇总2025 Mar 26, 2025 pm 04:45 PM

2025年，选择“正规”的以太坊交易平台意味着安全、合规、透明。持牌经营、资金安全、透明运营、AML/KYC、数据保护和公平交易是关键。 Coinbase、Kraken、Gemini 等合规交易所值得关注。币安和欧易有机会通过加强合规性成为正规平台。 DeFi 是一个选择，但也存在风险。务必关注安全性、合规性、费用，分散风险，备份私钥，并进行自己的研究。

2025全球十大加密货币交易所最新排名 Mar 26, 2025 pm 05:09 PM

要预测2025年加密货币交易所的排名很困难，因为市场变化迅速。重要的不是具体的排名，而是要了解影响排名的因素：监管合规、机构投资、DeFi整合、用户体验、安全性和全球化。 Binance、Coinbase、Kraken等都有望进入前十，但也可能出现黑天鹅事件。关注市场趋势和交易所的动态，不要盲信排名，投资前做好调研。