「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?
前段時間,微軟搞了個烏龍:隆重地開源了 WizardLM-2,又在不久後撤回得乾乾淨淨。
目前可查詢的WizardLM-2 發布訊息,這是一個「真正媲美GPT-4」的開源大模型,在復雜聊天、多語言、推理和代理方面的性能得到了提高。
系列包含三個模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:
- WizardLM-2 8x22B 是最先進的模型,也是高度複雜任務內部評估後得出的最佳開源 LLM。
- WizardLM-2 70B 具備頂級推理能力,是同等規模的首選;
- WizardLM-2 7B 是速度最快的,其效能可與現有的10 倍大的開源領先模型相媲美。
此外,透過人類偏好評估,WizardLM-28x22B 的能力「只是稍微落後於GPT-4-1106 預覽版,但明顯強於CommandRPlus 和GPT4-0314。開源里程碑嗎?
當大家忙著下載模型的時候,團隊卻突然撤回了一切:部落格、GitHub、HuggingFace 全部 404。
圖源:https://wizardlm.github.io/WizardLM2/
團隊的解釋是:
我們目前正在快速完成這項測試,然後將盡快重新發布我們的模型。不用擔心,感謝關心和理解。
但AI 社群對WizardLM-2 的關注和討論沒有停止,疑點有幾個:
第一,被刪除的開源專案不只是WizardLM-2,團隊所有的Wizard 系列工作都不見了,包括先前的WizardMath 和WizardCoder。
第二,有人質疑,刪除模型權重的同時,為何連部落格也刪除?如果是只是缺少測試部分,沒必要撤回得乾乾淨淨。
團隊的解釋是:「根據相關規定。」具體什麼規定?目前沒人知道。
第三,有人猜測 WizardLM 背後的團隊已經被解僱,撤回 Wizard 系列專案也是被迫的。
不過,這種猜測被團隊否定了:
##來源:https://x.com/_Mira___Mira_/status/1783716276944486751
#來源:https://x.com/ DavidFSWD/status/1783682898786152470
而且我們現在搜尋作者的名字,也沒有從微軟官網完全消失:
圖源:https://www.microsoft.com/en-us/research/people/qins/
第四,有人猜測,微軟撤回這個開源模型,一是因為效能太接近GPT-4,二是因為和OpenAI 的技術路線「撞車」了。
具體是什麼路線呢?我們可以看看當初部落格頁面的技術細節。
團隊表示,透過LLM 訓練,自然界中人類生成的資料日益枯竭,而AI 精心創建的資料和AI Step-by-Step 監督的模型將是通往更強大AI 的唯一途徑。
在過去的一年裡,微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統,如下圖所示。
大概分成幾個版塊:
資料預處理:
- 資料分析:使用這個pipeline 來獲得新來源資料的不同屬性的分佈,這有助於對資料有一個初步的了解。
- 加權採樣:最佳訓練資料的分佈往往與人類聊天語料的自然分佈不一致,需要根據實驗經驗調整訓練資料中各屬性的權重。
Evol Lab:
- Evol-Instruct:投入了大量精力重新評估了最初Evol-Instruct 方法中存在的各種問題,並對其進行了初步修改,新方法能讓各種智能體自動產生高品質的指令。
- Evol-Answer:引導模型多次產生和重寫回复,可以提高其邏輯性、正確性和親和力。
AI Align AI(AAA):
- 協同教學:收集WizardLM 和各種授權開源和專有的最先進模型,然後讓它們協同教學並相互提高,教學內容包括模擬聊天、品質評判、改進建議和縮小技能差距等。
- Self-Teaching:WizardLM 可以透過激活學習,為監督學習產生新的進化訓練數據,為強化學習產生偏好數據。
學習:
- 監督學習。
- 階段 - DPO:為了更有效地進行離線強化學習,將優選資料分割成不同的片段,並逐級改進模型。
- RLEIF:採用指令品質獎勵模型(IRM)與過程監督獎勵模型(PRM)結合的方法,使得在線上強化學習中實現更精確的正確性。
最後要說的是,任何猜測都是徒勞的,讓我們期待一下 WizardLM-2 的複出吧。
以上是「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。
