在Xai的Grok-3早期访问阶段,AI爱好者,开发人员和研究人员毫不犹豫地浪费了时间来推动其限制并探索其功能。从游戏开发到推理测试,第一印象表明,Grok-3是AI领域中的一个认真竞争者,与OpenAI的顶级模型DeepSeek-R1和Google的Gemini媲美。
> 目录的
grok的核心承诺:没有偏见的AI
>他设想了一个“寻求真相”的AI,该AI提供了客观事实而无需过滤或软化信息以适合社会或政治叙事。
真理是不舒服还是有争议的,Grok旨在追求它,就像其竞争对手一样,反映了硅谷公司的价值。
Grok 3刚刚发布。您不会相信它,我已经创建了一个游戏。
(今天早上我得到了早期的访问)。
>>我一直在要求调整,它一直在吐痰……pic.twitter.com/bmtie3u4kf我的- penny2x(@impenny2x)2025年2月18日
>对于开发人员来说,这是巨大的。 AI生成的游戏代码并不是什么新鲜事物,但是Grok-3在没有API集成的情况下如此无缝地执行此操作,并且与GPT-4O和SONET这样的模型的感觉非常出色。如果Grok-3可以更好地集成到开发人员工作流程中,它可能会改变独立开发人员和工作室创建游戏的方式。
>
“我只是告诉了我想要的东西,然后构建了游戏。
>最引人注目的早期用例之一来自Penny2X,他在访问后数小时仅使用Grok-3从头开始制造了整个游戏。
>
“这个游戏是由Grok创建的100%。我只是告诉了我想要的东西,然后将代码放在正确的位置。我一直在要求调整,并且它一直在我可以运行的一个文件中吐出游戏。
这是一个令人兴奋的里程碑。 Grok-3的实时调整和生成可运行的游戏代码的能力可能意味着开发人员的原型更快。如果XAI优化其用于生产使用的API,我们可能会看到AI辅助游戏开发的重大转变。
>Andrej Karpathy的“ Vibe检查”:Grok-3可以思考吗?>我今天早些时候就可以尽早进入Grok 3,这让我我认为最初可以进行快速氛围检查的人之一。
思考
✅>首先,Grok 3显然具有艺术性思维模型的状态(Think Think'按钮)(“ Think Think”按钮)(“ Think”按钮),并且在我的定居者的catan of Catean of Catean of catan Imppoter and toppoter y。 (@karpathy)2025年2月18日
>他还测试了逻辑难题,TIC-TAC-TOE董事会的生成和数学估计(例如计算GPT-2的训练拖鞋)。在需要深层推理的任务中,Grok-3的表现优于GPT-4O和O1-PRO,即使没有自己的推理功能,这也使估计任务失败了。
>“我得到的印象是Grok-3在O1-Pro能力周围,并且在DeepSeek-R1之前。 但是,Grok-3并不完美。它在一些拼图生成任务上挣扎,表情符号编码挑战,并且在信息检索中仍然偶尔会产生幻觉。 我的
“思考”模式似乎是Grok-3最大的优势之一。在大多数聊天机器人与实时解决问题的时代中,Grok-3在逻辑上“通过”复杂的查询(而不仅仅是反流答案)的能力使它领先于许多竞争对手。但是,正如Karpathy所指出的那样,真正的基准和评估将讲述完整的故事。
>也请阅读:Andrej Karpathy对Grok 3!> grok-3 vs.其他AI模型:如何堆叠?
>不仅是推理,还针对有关知识检索,深入搜索,幽默和道德决策的领先模型的Grok-3进行了测试。
深度搜索:研究和现实世界查询(gpt-4o&o1-pro失败!)
✅试图解决> riemann假设,而不是完全放弃(与Gemini&Claude!)
但是,它仍然在以下错误中犯错:
emoji emoji emoji编码神秘的谜题 > > >> >
在某些推理任务中,Grok-3似乎与OpenAI的最佳型号(O1-Pro,200美元/月)相提并论。但是,它仍然需要进行幽默,实时研究准确性和拼图产生的改进。
>>> grok 3可能是现实世界物理学的最佳基础LLM!
- yuchen jin(@yuchenj_uw)2025年2月18日
>提示:“在旋转的tesseract中写下球弹跳的python脚本”。
没有“思考”或“大脑”模式启用,它就是基础模型。我对尝试他们的推理模型非常感兴趣。 pic.twitter.com/fv2rfebb4j
ai研究人员yuchen jin在基于物理的编码挑战上测试了Grok-3 ,并印象深刻。
“ Grok 3可能是现实世界中最佳的基础LLM!提示:‘在旋转的Tesseract中写下球弹跳的python脚本。’启用了“思考”模式,只有基本模型。我对尝试他们的推理模型非常感兴趣。我的 如果Grok-3可以有效地处理物理模拟,那么对于研究人员,工程师和开发人员来说,这可能是模拟较重的领域的巨大胜利。
grok-3 Wake?刚获得3 grok 3,我现在的准确性使我感到震惊? pic.twitter.com/poeigyfnml
- 2025年2月18日,⚡️DezmondOliver⚡️(@dezmondoliver) 这引起了关于视觉模型中AI偏见的有趣讨论。尽管Grok-3看起来很高级,但AI模型仍然在细微的身份表示方面挣扎。这并不是Grok独有的 - 许多AI系统,包括Midjourney,Dall·E和稳定的扩散,在无偏表示方面面临着类似的挑战。>
最终判决:Grok-3是一个真正的AI竞争者吗?✅
✅在逻辑难题,深入搜索和实时研究
远程AI中脱颖而出,现在使用AI的游戏开发更加顺畅,基于物理学的速度更加顺畅,基于物理学的编码显示出令人鼓舞的结果
>
仍然会幻觉信息并生成假的URL
❌难题和棋盘游戏生成需要工作
>
也请阅读:Grok-3(代号为“巧克力”)现在在聊天机器人竞技场
>在下面的评论部分中,让我知道您对Grok-3的想法! 用Xai Grok 3:地球上最聪明的AI解锁未来!深入研究游戏开发,高级推理和现实世界任务。现在注册并掌握AI创新!
以上是Grok 3行动:游戏开发,推理等的详细内容。更多信息请关注PHP中文网其他相关文章!