開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 30, 2024 am 08:01 AM

數據訓練

Grok-1官宣开源不过半月，新升级的Grok-1.5出炉了。

刚刚，马斯克xAI官宣，128K上下文Grok-1.5，推理能力大幅提升。

并且，很快就会上线。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

11天前，Grok-1模型的权重和架构开源，展示了Xai在去年11月之前取得的进展。

Grok-1有3140亿参数，是Llama 2的4倍大，而且采用的是MoE架构，8个专家中2个是活跃专家。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

Xai介绍，也就是从那时起，团队改进了最新模型Grok-1.5的推理和解决问题的能力。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

OpenAI前开发者关系负责人表示，从xAI重大发布的时间可以看出他们前进的步伐和紧迫感。令人振奋！

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

128K上下文，Grok-1.5数学推理能力暴涨

根据官方介绍，Grok-1.5改进了推理能力，上下文长度为128K。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

Grok-1.5最显著的改进之一是，它在编码和数学相关任务中的表现。

在测试中，Grok-1.5在数学基准上取得50.6%的得分，在GSM8K基准上获得了90%，这两个数学基准涵盖了从小学到高中的各种竞赛问题。

此外，在评估代码生成和解决问题能力的HumanEval基准测试中，Grok-1.5获得了74.1%的高分。

从下图中，与Grok-1相比，可以看出Grok-1.5在数学方面的能力得到大幅提升，GSM8K上从62.9%改进到90，MATH上从23.9%提升到50.6%。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

128K长语境理解，扩增16倍

Grok-1.5另一全新特点是，能够在其上下文窗口内处理高达128K token的文本。

这使Grok的内存容量，增加到以前上下文长度的16倍，从而使它能够利用更长的文档中的信息。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

此外，新模型还可以处理更长和更复杂的提示，同时在其上下文窗口扩展时仍保持其指令跟随能力。

在Needle In A Haystack（NIAH）评估中，Grok-1.5 展示了强大的检索能力，可检索长度达 128K 字节的上下文中的嵌入文本，并取得了完美的检索结果。

Grok-1.5基础设施

Grok-1.5构建在基于JAX、Rust和Kubernetes的定制分布式训练框架之上。

这个训练堆栈可以让xAI团队能够以最少的投入，大规模构建创意，以及训练新的架构。

在大型计算群集上进行训练LLM的一个主要挑战是，最大限度地提高训练任务的可靠性和正常运行时间。

xAI定制的训练编排器，可确保自动检测有问题的节点，并将其从训练任务剔除。

与此同时，他们还优化了检查点、数据加载和训练任务的重启，以最大限度地减少发生故障时的停机时间。

xAI表示，Grok-1.5很快就會提供給早期測試者，以幫助改進模型。

部落格也預告了Grok-1.5將在未來幾天推出幾個新功能。

最後，xAI還是一如既往地po出了招募資訊。

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

以上是開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7814

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1237

Related knowledge

使用ddrescue在Linux上恢復數據 Mar 20, 2024 pm 01:37 PM

DDREASE是一種用於從檔案或區塊裝置(如硬碟、SSD、RAM磁碟、CD、DVD和USB儲存裝置)復原資料的工具。它將資料從一個區塊設備複製到另一個區塊設備，留下損壞的資料區塊，只移動好的資料區塊。 ddreasue是一種強大的恢復工具，完全自動化，因為它在恢復操作期間不需要任何干擾。此外，由於有了ddasue地圖文件，它可以隨時停止和恢復。 DDREASE的其他主要功能如下：它不會覆寫恢復的數據，但會在迭代恢復的情況下填補空白。但是，如果指示工具明確執行此操作，則可以將其截斷。將資料從多個檔案或區塊還原到單

開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！ Apr 03, 2024 pm 12:04 PM

0.這篇文章乾了啥？提出了DepthFM：一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外，DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高，可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題：DepthFM:FastMonocularDepthEstimationwithFlowMatching作者：MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow，7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中，Pytorch依然比Tensorflow更受歡迎。但未來，也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近，Keras團隊為三個後端（TensorFlow、JAX、PyTorch）與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先，他們為生成式和非生成式人工智慧任務選擇了一組主流

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas，正式進入電動機器人時代！昨天，液壓Atlas剛「含淚」退出歷史舞台，今天波士頓動力就宣布：電動Atlas上崗。看來，在商用人形機器人領域，波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後，短短十幾小時內，就已經有一百多萬觀看。舊人離去，新角色登場，這是歷史的必然。毫無疑問，今年是人形機器人的爆發年。網友銳評：機器人的進步，讓今年看起來像人類的開幕式動作、自由度遠超人類，但這真不是恐怖片？影片一開始，Atlas平靜地躺在地上，看起來應該是仰面朝天。接下來，讓人驚掉下巴

iPhone上的蜂窩數據網路速度慢：修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯後，緩慢的行動數據連線？通常，手機上蜂窩互聯網的強度取決於幾個因素，例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時，強制重啟設備只會重置許多內容，包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來，按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度，但在訊號較弱

特斯拉機器人進廠打工，馬斯克：手的自由度今年將達到22個！ May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐，已經可以在工廠裡打工了。正常速度下，它分揀電池（特斯拉的4680電池）是這樣的：官方還放出了20倍速下的樣子——在小小的「工位」上，揀啊揀啊揀：這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作，是完全自主的，全程沒有人為的干預。而且在Optimus的視角之下，它還可以把放歪了的電池重新撿起來放置，主打一個自動糾錯：對於Optimus的手，英偉達科學家JimFan給出了高度的評價：Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

超級智能體生命力覺醒！可自我更新的AI來了，媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊，全球狂煉大模型，一網路的資料不夠用，根本不夠用。訓練模型搞得跟《飢餓遊戲》似的，全球AI研究者，都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中，這問題尤其突出。一籌莫展之際，來自人大系的初創團隊，用自家的新模型，率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下，兩側都能產生高品質、多模態的新數據，對模型本身進行數據反哺。模型是啥？中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰？智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立，高

阿里7B多模態文件理解大模型拿下新SOTA Apr 02, 2024 am 11:31 AM

多模態文件理解能力新SOTA！阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl1.5，針對高解析度圖片文字辨識、通用文件結構理解、指令遵循、外部知識引入四大挑戰，提出了一系列解決方案。話不多說，先來看效果。複雜結構的圖表一鍵識別轉換為Markdown格式：不同樣式的圖表都可以：更細節的文字識別和定位也能輕鬆搞定：還能對文檔理解給出詳細解釋：要知道，“文檔理解”目前是大語言模型實現落地的一個重要場景，市面上有許多輔助文檔閱讀的產品，有的主要透過OCR系統進行文字識別，配合LLM進行文字理

See all articles

開源11天，馬斯克再發Grok-1.5！128K代碼擊敗GPT-4

128K上下文，Grok-1.5数学推理能力暴涨

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題