仅几个月前,DeepSeek的V3,R1和Janus模型在AI社区中引起了轰动。 现在,埃隆·马斯克(Elon Musk)的格罗克(Grok)3进入了竞技场,拥有“地球上最聪明的AI”标题。 XAI的最初基准非常令人印象深刻,显示了在各种测试中超过3的竞争对手。但是它如何在日常任务上执行? $ 40 x高级订阅值得吗?本文比较了五个不同提示的Grok 3和DeepSeek R1。
目录的
>任务1:Python代码生成
> >提示:
“编写一个python函数,使用深度优先搜索来生成一个随机的迷宫,并使用matplotlib可视化。>(请参阅原始文本中的代码和图像比较。维护原始格式和图像。)
观察: DeepSeek R1产生了一个清晰,结构良好的迷宫。尽管使用了DFS,但Grok 3的输出被像素化且定义较少。
>判决: grok 3❌deepSeek r1
>任务2:Web Search
(注意:DeepSeek R1用于此任务。)>
提示:“截至2025年,核融合技术的最新进步是什么?格式:进步列表来源。 (维护原始视频嵌入。)
> 观察:
DeepSeek R1为每个索赔提供了可验证的来源,提供了更全面和值得信赖的响应。 Grok 3缺少直接源链接,依赖于X(以前为Twitter)等可靠来源。>判决: grok 3❌deepSeek r1
>任务3:基本HTML动画
>>提示:“创建HTML CSS代码,以连续旋转正方形。”
(维护原始代码段和嵌入视频。
>观察:grok 3难以生成正确的代码。 DeepSeek R1虽然较慢,但提供了准确且功能上的代码。
>判决:grok 3❌deepSeek r1
任务4:图像分析(国际象棋)> >
提示:“分析此棋盘位置。建议对白色的最佳动作来检查黑色并解释推理。”
(维护原始图像比较。)>
观察:两个模型都无法正确识别检查员。
>判决:grok 3❌deepSeek r1
任务5:逻辑推理(Zebra upzle)
提示:“解决这个斑马拼图。给我表中的输出。”
>(维护原始图像比较。)
>>观察:
>判决: grok 3❌deepSeek r1
grok 3 vs. deepseek r1:结果>
(维护原始表。)
结论
> Grok 3的营销主张是“最聪明的AI”,这一现实世界测试没有支持。 DeepSeek R1在准确性,结构和可验证性方面始终超过3。 尽管Grok 3在某些领域表现出潜力,但其逻辑推理和复杂问题解决方案的弱点很重要。 未来的更新是否会改善Grok 3还有待观察。 结果表明,XAI需要对其培训方法进行大量改进。
(维护原始的电话和博客链接。)>
以上是Grok 3与DeepSeek R1:哪个更好?的详细内容。更多信息请关注PHP中文网其他相关文章!