Gemma 3与DeepSeek-R1：Google的新27b型号更好吗？-人工智能-PHP中文网

Gemma 3与DeepSeek-R1：Google的新27b型号更好吗？

尊渡假赌尊渡假赌尊渡假赌

发布： 2025-03-20 15:27:10

原创

871 人浏览过

Google的新轻巧语言模型Gemma 3正在引起波浪。基准测试表明，它超过了Meta的Llama 3，DeepSeek-V3和Openai的O3 Mini。 Google称其为“世界上最好的单加速器模型”，但是它如何与其他领先的模型（尤其是中国的DeepSeek-R1）相抵触？该比较深入研究了他们的功能，性能和基准分数。

什么是Gemma 3？
- Gemma 3的主要特征
- 访问Gemma 3
Gemma 3与DeepSeek-R1：功能比较
Gemma 3与DeepSeek-R1：性能比较
- 任务1：代码生成（动画）
- 任务2：逻辑推理
- 任务3：解决问题问题
- 性能摘要
Gemma 3与DeepSeek-R1：基准比较
结论
常见问题

什么是Gemma 3？

Gemma 3是Google最新的开源AI模型系列。它的设计优先考虑从智能手机到高功率工作站的各种设备的有效部署。一个关键的创新是其多模式功能（多亏了Paligemma 2），允许处理文本，图像和音频。值得注意的是，尽管具有相对较小的27b参数大小（与使用数千个GPU的模型相比，它在某些基准测试中的表现都优于较大的竞争对手。

Gemma 3的主要特征：

可扩展大小：可在1B，4B，12B和27B参数版本中使用。
轻量级： 27B型号以效率达到高性能。
单个加速器：用于单个GPU/TPU的优化。
多模式：过程文本，图像和简短视频。
Google集成：从Google Drive直接上传文件。
多语言：支持140多种语言。
扩展的上下文：提供较大的上下文窗口（在27b型号中最多128K代币）。
安全功能：包括有关内容安全性的ShieldGemma 2。

访问Gemma 3：

Gemma 3可以通过Google AI Studio访问。指示：

打开Google AI Studio： [链接到Google AI Studio]
登录/注册：使用您的Google帐户。
选择Gemma 3 27b：从下拉菜单中选择模型。

或者，通过拥抱面孔访问或与Keras，Jax和Ollama一起使用。

Gemma 3与DeepSeek-R1：功能比较

特征	Gemma 3	DeepSeek-R1
型号大小	1b，4b，12b，27b参数	671b总数（每个查询37B活动）
上下文窗口	多达128K令牌（27b型号）	多达128K令牌
GPU要求	单个GPU/TPU	高端GPU（H800/H100）
图像生成	不	不
图像分析	是（通过siglip）	否（仅从图像中提取文本）
视频分析	是（短夹）	不
多模式	文字，图像，视频	主要基于文本
文件上传	文字，图像，视频	主要是文本输入
网络搜索	不	是的
语言	35支持，在140中接受培训	最适合英语和中文
安全	强（Shieldgemma 2）	安全性弱，潜在的越狱

Gemma 3与DeepSeek-R1：性能比较

使用三个任务来比较性能：代码生成，逻辑推理和解决问题问题。

任务1：代码生成（动画）

提示： “编写一个Python程序，以使旋转五角大楼内的球弹跳起来，坚持物理，每次弹跳都会提高速度。”

Gemma 3：快速生成代码，但未能创建一个工作的动画。 DeepSeek-R1：制作了功能动画，尽管较慢。

获胜者： DeepSeek-R1

任务2：逻辑推理

提示：一个4英寸的立方体被涂成蓝色。它被切成1英寸的立方体。多少立方体有3、2、1或0蓝色的侧面？

两种模型都正确解决了难题。 Gemma 3明显更快。

获胜者： Gemma 3

任务3：解决问题问题

提示： 500公斤卫星在500公里的高度绕地球绕地球。计算轨道速度和周期。（给定地球的质量和半径，重力常数）。

两种模型都提供了解决方案，但是Gemma 3在此期间造成了较小的计算误差。 DeepSeek-R1的解决方案更准确。

获胜者： DeepSeek-R1

性能摘要

任务	Gemma 3性能	DeepSeek-R1性能	优胜者
代码生成	快速，但无法制作工作动画	较慢，但制作了一个工作动画	DeepSeek-R1
逻辑推理	正确，非常快	正确，慢	Gemma 3
茎问题解决	主要是正确的，快速，次要的计算错误	正确，慢	DeepSeek-R1