在Xai的Grok-3早期訪問階段,AI愛好者,開發人員和研究人員毫不猶豫地浪費了時間來推動其限制並探索其功能。從遊戲開發到推理測試,第一印象表明,Grok-3是AI領域中的一個認真競爭者,與OpenAI的頂級模型DeepSeek-R1和Google的Gemini媲美。
> 目錄的
grok的核心承諾:沒有偏見的AI
>他設想了一個“尋求真相”的AI,該AI提供了客觀事實而無需過濾或軟化信息以適合社會或政治敘事。
真理是不舒服還是有爭議的,Grok旨在追求它,就像其競爭對手一樣,反映了矽谷公司的價值。
Grok 3剛剛發布。您不會相信它,我已經創建了一個遊戲。
(今天早上我得到了早期的訪問)。
>>我一直在要求調整,它一直在吐痰……pic.twitter.com/bmtie3u4kf我的- penny2x(@impenny2x)2025年2月18日
>對於開發人員來說,這是巨大的。 AI生成的遊戲代碼並不是什麼新鮮事物,但是Grok-3在沒有API集成的情況下如此無縫地執行此操作,並且與GPT-4O和SONET這樣的模型的感覺非常出色。如果Grok-3可以更好地集成到開發人員工作流程中,它可能會改變獨立開發人員和工作室創建遊戲的方式。
>
“我只是告訴了我想要的東西,然後構建了遊戲。
>最引人注目的早期用例之一來自Penny2X,他在訪問後數小時僅使用Grok-3從頭開始製造了整個遊戲。
>
“這個遊戲是由Grok創建的100%。我只是告訴了我想要的東西,然後將代碼放在正確的位置。我一直在要求調整,並且它一直在我可以運行的一個文件中吐出遊戲。
這是一個令人興奮的里程碑。 Grok-3的實時調整和生成可運行的遊戲代碼的能力可能意味著開發人員的原型更快。如果XAI優化其用於生產使用的API,我們可能會看到AI輔助遊戲開發的重大轉變。
>Andrej Karpathy的“ Vibe檢查”:Grok-3可以思考嗎?>我今天早些時候就可以儘早進入Grok 3,這讓我我認為最初可以進行快速氛圍檢查的人之一。
思考
✅>首先,Grok 3顯然具有藝術性思維模型的狀態(Think Think'按鈕)(“ Think Think”按鈕)(“ Think”按鈕),並且在我的定居者的catan of Catean of Catean of catan Imppoter and toppoter y。 (@karpathy)2025年2月18日
>他還測試了邏輯難題,TIC-TAC-TOE董事會的生成和數學估計(例如計算GPT-2的訓練拖鞋)。在需要深層推理的任務中,Grok-3的表現優於GPT-4O和O1-PRO,即使沒有自己的推理功能,這也使估計任務失敗了。
>“我得到的印像是Grok-3在O1-Pro能力周圍,並且在DeepSeek-R1之前。 但是,Grok-3並不完美。它在一些拼圖生成任務上掙扎,表情符號編碼挑戰,並且在信息檢索中仍然偶爾會產生幻覺。 我的
“思考”模式似乎是Grok-3最大的優勢之一。在大多數聊天機器人與實時解決問題的時代中,Grok-3在邏輯上“通過”複雜的查詢(而不僅僅是反流答案)的能力使它領先於許多競爭對手。但是,正如Karpathy所指出的那樣,真正的基準和評估將講述完整的故事。
>也請閱讀:Andrej Karpathy對Grok 3! > grok-3 vs.其他AI模型:如何堆疊?
>不僅是推理,還針對有關知識檢索,深入搜索,幽默和道德決策的領先模型的Grok-3進行了測試。
深度搜索:研究和現實世界查詢(gpt-4o&o1-pro失敗!)
✅試圖解決> riemann假設,而不是完全放棄(與Gemini&Claude!)
但是,它仍然在以下錯誤中犯錯:
emoji emoji emoji編碼神秘的謎題 > > >> >
在某些推理任務中,Grok-3似乎與OpenAI的最佳型號(O1-Pro,200美元/月)相提並論。但是,它仍然需要進行幽默,實時研究準確性和拼圖產生的改進。
>>> grok 3可能是現實世界物理學的最佳基礎LLM!
- yuchen jin(@yuchenj_uw)2025年2月18日
>提示:“在旋轉的tesseract中寫下球彈跳的python腳本”。
沒有“思考”或“大腦”模式啟用,它就是基礎模型。我對嘗試他們的推理模型非常感興趣。 pic.twitter.com/fv2rfebb4j
ai研究人員yuchen jin在基於物理的編碼挑戰上測試了Grok-3 ,並印象深刻。
“ Grok 3可能是現實世界中最佳的基礎LLM!提示:‘在旋轉的Tesseract中寫下球彈跳的python腳本。’啟用了“思考”模式,只有基本模型。我對嘗試他們的推理模型非常感興趣。我的 如果Grok-3可以有效地處理物理模擬,那麼對於研究人員,工程師和開發人員來說,這可能是模擬較重的領域的巨大勝利。
grok-3 Wake?剛獲得3 grok 3,我現在的準確性使我感到震驚? pic.twitter.com/poeigyfnml
- 2025年2月18日,⚡️DezmondOliver⚡️(@dezmondoliver) 這引起了關於視覺模型中AI偏見的有趣討論。儘管Grok-3看起來很高級,但AI模型仍然在細微的身份表示方面掙扎。這並不是Grok獨有的 - 許多AI系統,包括Midjourney,Dall·E和穩定的擴散,在無偏表示方面面臨著類似的挑戰。>
最終判決:Grok-3是一個真正的AI競爭者嗎?✅
✅在邏輯難題,深入搜索和實時研究
遠程AI中脫穎而出,現在使用AI的遊戲開發更加順暢,基於物理學的速度更加順暢,基於物理學的編碼顯示出令人鼓舞的結果
>
仍然會幻覺信息並生成假的URL
❌難題和棋盤遊戲生成需要工作
>
也請閱讀:Grok-3(代號為“巧克力”)現在在聊天機器人競技場
>在下面的評論部分中,讓我知道您對Grok-3的想法! 用Xai Grok 3:地球上最聰明的AI解鎖未來!深入研究遊戲開發,高級推理和現實世界任務。現在註冊並掌握AI創新!
以上是Grok 3行動:遊戲開發,推理等的詳細內容。更多資訊請關注PHP中文網其他相關文章!