Grok 3与DeepSeek R1：哪个更好？-人工智能-PHP中文网

Grok 3与DeepSeek R1：哪个更好？

Lisa Kudrow

发布： 2025-03-04 09:51:11

原创

178 人浏览过

仅几个月前，DeepSeek的V3，R1和Janus模型在AI社区中引起了轰动。现在，埃隆·马斯克（Elon Musk）的格罗克（Grok）3进入了竞技场，拥有“地球上最聪明的AI”标题。 XAI的最初基准非常令人印象深刻，显示了在各种测试中超过3的竞争对手。但是它如何在日常任务上执行？ $ 40 x高级订阅值得吗？本文比较了五个不同提示的Grok 3和DeepSeek R1。

目录的 Grok 3 vs DeepSeek R1: Which is Better?

表：

>任务1：Python代码生成

>
任务1：Python代码生成

> >提示：

“编写一个python函数，使用深度优先搜索来生成一个随机的迷宫，并使用matplotlib可视化。

>（请参阅原始文本中的代码和图像比较。维护原始格式和图像。）

观察： DeepSeek R1产生了一个清晰，结构良好的迷宫。尽管使用了DFS，但Grok 3的输出被像素化且定义较少。

>判决： grok 3❌deepSeek r1

任务2：Web Search

（注意：DeepSeek R1用于此任务。）

提示：

“截至2025年，核融合技术的最新进步是什么？格式：进步列表来源。（维护原始视频嵌入。）

> 观察：

DeepSeek R1为每个索赔提供了可验证的来源，提供了更全面和值得信赖的响应。 Grok 3缺少直接源链接，依赖于X（以前为Twitter）等可靠来源。

>判决： grok 3❌deepSeek r1

>任务3：基本HTML动画

>提示：“创建HTML CSS代码，以连续旋转正方形。”

（维护原始代码段和嵌入视频。

>观察：

grok 3难以生成正确的代码。 DeepSeek R1虽然较慢，但提供了准确且功能上的代码。

>判决：

grok 3❌deepSeek r1

任务4：图像分析（国际象棋）

> >

提示：

“分析此棋盘位置。建议对白色的最佳动作来检查黑色并解释推理。”

（维护原始图像比较。）

观察：

两个模型都无法正确识别检查员。

>判决：

grok 3❌deepSeek r1

任务5：逻辑推理（Zebra upzle）

提示：“解决这个斑马拼图。给我表中的输出。”

（维护原始图像比较。）

>观察：

>判决： grok 3❌deepSeek r1

grok 3 vs. deepseek r1：结果>

（维护原始表。）

结论

> Grok 3的营销主张是“最聪明的AI”，这一现实世界测试没有支持。 DeepSeek R1在准确性，结构和可验证性方面始终超过3。尽管Grok 3在某些领域表现出潜力，但其逻辑推理和复杂问题解决方案的弱点很重要。未来的更新是否会改善Grok 3还有待观察。结果表明，XAI需要对其培训方法进行大量改进。

（维护原始的电话和博客链接。）>

以上是Grok 3与DeepSeek R1：哪个更好？的详细内容。更多信息请关注PHP中文网其他相关文章！