首页 > 科技周边 > 人工智能 > Grok 3与DeepSeek R1:哪个更好?

Grok 3与DeepSeek R1:哪个更好?

Lisa Kudrow
发布: 2025-03-04 09:51:11
原创
178 人浏览过

仅几个月前,DeepSeek的V3,R1和Janus模型在AI社区中引起了轰动。 现在,埃隆·马斯克(Elon Musk)的格罗克(Grok)3进入了竞技场,拥有“地球上最聪明的AI”标题。 XAI的最初基准非常令人印象深刻,显示了在各种测试中超过3的竞争对手。但是它如何在日常任务上执行? $ 40 x高级订阅值得吗?本文比较了五个不同提示的Grok 3和DeepSeek R1。

目录的Grok 3 vs DeepSeek R1: Which is Better?

表:

>任务1:Python代码生成

    >任务2:Web搜索
  • >任务3:基本HTML动画
  • >任务4:图像分析(国际象棋)
  • >任务5:逻辑推理(斑马拼图)
  • >
  • grok 3 vs. deepseek r1:结果
  • 结论
  • 任务1:Python代码生成

> >提示:

“编写一个python函数,使用深度优先搜索来生成一个随机的迷宫,并使用matplotlib可视化。

>(请参阅原始文本中的代码和图像比较。维护原始格式和图像。)

观察: DeepSeek R1产生了一个清晰,结构良好的迷宫。尽管使用了DFS,但Grok 3的输出被像素化且定义较少。

>判决: grok 3❌deepSeek r1

>

任务2:Web Search

(注意:DeepSeek R1用于此任务。)

>

提示:

“截至2025年,核融合技术的最新进步是什么?格式:进步列表来源。 (维护原始视频嵌入。)

> 观察:

DeepSeek R1为每个索赔提供了可验证的来源,提供了更全面和值得信赖的响应。 Grok 3缺少直接源链接,依赖于X(以前为Twitter)等可靠来源。

>判决: grok 3❌deepSeek r1

>任务3:基本HTML动画

>

>提示:“创建HTML CSS代码,以连续旋转正方形。”

(维护原始代码段和嵌入视频。

>观察:

grok 3难以生成正确的代码。 DeepSeek R1虽然较慢,但提供了准确且功能上的代码。

>判决:

grok 3❌deepSeek r1

任务4:图像分析(国际象棋)

> >

提示:

“分析此棋盘位置。建议对白色的最佳动作来检查黑色并解释推理。”

(维护原始图像比较。)

>

观察:

两个模型都无法正确识别检查员。

>判决:

grok 3❌deepSeek r1

任务5:逻辑推理(Zebra upzle)

提示:“解决这个斑马拼图。给我表中的输出。”

>

(维护原始图像比较。)

>

>观察:

>判决: grok 3❌deepSeek r1

grok 3 vs. deepseek r1:结果>

(维护原始表。)

结论

> Grok 3的营销主张是“最聪明的AI”,这一现实世界测试没有支持。 DeepSeek R1在准确性,结构和可验证性方面始终超过3。 尽管Grok 3在某些领域表现出潜力,但其逻辑推理和复杂问题解决方案的弱点很重要。 未来的更新是否会改善Grok 3还有待观察。 结果表明,XAI需要对其培训方法进行大量改进。

(维护原始的电话和博客链接。)>

以上是Grok 3与DeepSeek R1:哪个更好?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板