前段時間,微軟搞了個烏龍:隆重地開源了 WizardLM-2,又在不久後撤回得乾乾淨淨。
目前可查詢的WizardLM-2 發布訊息,這是一個「真正媲美GPT-4」的開源大模型,在復雜聊天、多語言、推理和代理方面的性能得到了提高。
系列包含三個模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:
此外,透過人類偏好評估,WizardLM-28x22B 的能力「只是稍微落後於GPT-4-1106 預覽版,但明顯強於CommandRPlus 和GPT4-0314。開源里程碑嗎?
當大家忙著下載模型的時候,團隊卻突然撤回了一切:部落格、GitHub、HuggingFace 全部 404。
圖源:https://wizardlm.github.io/WizardLM2/
團隊的解釋是:
所有Huggingface 的朋友們,大家好!很抱歉,我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了,所以我們現在不熟悉新的發布流程:我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的步驟。我們目前正在快速完成這項測試,然後將盡快重新發布我們的模型。不用擔心,感謝關心和理解。
但AI 社群對WizardLM-2 的關注和討論沒有停止,疑點有幾個:
第一,被刪除的開源專案不只是WizardLM-2,團隊所有的Wizard 系列工作都不見了,包括先前的WizardMath 和WizardCoder。
第二,有人質疑,刪除模型權重的同時,為何連部落格也刪除?如果是只是缺少測試部分,沒必要撤回得乾乾淨淨。
團隊的解釋是:「根據相關規定。」具體什麼規定?目前沒人知道。
#第三,有人猜測 WizardLM 背後的團隊已經被解僱,撤回 Wizard 系列專案也是被迫的。
不過,這種猜測被團隊否定了:
##來源:https://x.com/_Mira___Mira_/status/1783716276944486751
#來源:https://x.com/ DavidFSWD/status/1783682898786152470
而且我們現在搜尋作者的名字,也沒有從微軟官網完全消失:
圖源:https://www.microsoft.com/en-us/research/people/qins/
第四,有人猜測,微軟撤回這個開源模型,一是因為效能太接近GPT-4,二是因為和OpenAI 的技術路線「撞車」了。
具體是什麼路線呢?我們可以看看當初部落格頁面的技術細節。
團隊表示,透過LLM 訓練,自然界中人類生成的資料日益枯竭,而AI 精心創建的資料和AI Step-by-Step 監督的模型將是通往更強大AI 的唯一途徑。
在過去的一年裡,微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統,如下圖所示。
大概分成幾個版塊:
資料預處理:
Evol Lab:
AI Align AI(AAA):
學習:
最後要說的是,任何猜測都是徒勞的,讓我們期待一下 WizardLM-2 的複出吧。
以上是「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?的詳細內容。更多資訊請關注PHP中文網其他相關文章!