「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

PHPz

Apr 30, 2024 pm 04:40 PM

git ai 模型

前段時間，微軟搞了個烏龍：隆重地開源了 WizardLM-2，又在不久後撤回得乾乾淨淨。

目前可查詢的WizardLM-2 發布訊息，這是一個「真正媲美GPT-4」的開源大模型，在復雜聊天、多語言、推理和代理方面的性能得到了提高。

系列包含三個模型：WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中：

WizardLM-2 8x22B 是最先進的模型，也是高度複雜任務內部評估後得出的最佳開源 LLM。
WizardLM-2 70B 具備頂級推理能力，是同等規模的首選；
WizardLM-2 7B 是速度最快的，其效能可與現有的10 倍大的開源領先模型相媲美。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

此外，透過人類偏好評估，WizardLM-28x22B 的能力「只是稍微落後於GPT-4-1106 預覽版，但明顯強於CommandRPlus 和GPT4-0314。開源里程碑嗎？

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？當大家忙著下載模型的時候，團隊卻突然撤回了一切：部落格、GitHub、HuggingFace 全部 404。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

圖源：https://wizardlm.github.io/WizardLM2/

團隊的解釋是：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

所有Huggingface 的朋友們，大家好！很抱歉，我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了，所以我們現在不熟悉新的發布流程：我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的步驟。

我們目前正在快速完成這項測試，然後將盡快重新發布我們的模型。不用擔心，感謝關心和理解。

但AI 社群對WizardLM-2 的關注和討論沒有停止，疑點有幾個：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？第一，被刪除的開源專案不只是WizardLM-2，團隊所有的Wizard 系列工作都不見了，包括先前的WizardMath 和WizardCoder。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

第二，有人質疑，刪除模型權重的同時，為何連部落格也刪除？如果是只是缺少測試部分，沒必要撤回得乾乾淨淨。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

團隊的解釋是：「根據相關規定。」具體什麼規定？目前沒人知道。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

第三，有人猜測 WizardLM 背後的團隊已經被解僱，撤回 Wizard 系列專案也是被迫的。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

不過，這種猜測被團隊否定了：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

##來源：https://x.com/_Mira___Mira_/status/1783716276944486751

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

#來源：https://x.com/ DavidFSWD/status/1783682898786152470

而且我們現在搜尋作者的名字，也沒有從微軟官網完全消失：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

圖源：https://www.microsoft.com/en-us/research/people/qins/

第四，有人猜測，微軟撤回這個開源模型，一是因為效能太接近GPT-4，二是因為和OpenAI 的技術路線「撞車」了。

具體是什麼路線呢？我們可以看看當初部落格頁面的技術細節。

團隊表示，透過LLM 訓練，自然界中人類生成的資料日益枯竭，而AI 精心創建的資料和AI Step-by-Step 監督的模型將是通往更強大AI 的唯一途徑。

在過去的一年裡，微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統，如下圖所示。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

大概分成幾個版塊：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

資料預處理：

資料分析：使用這個pipeline 來獲得新來源資料的不同屬性的分佈，這有助於對資料有一個初步的了解。
加權採樣：最佳訓練資料的分佈往往與人類聊天語料的自然分佈不一致，需要根據實驗經驗調整訓練資料中各屬性的權重。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

Evol Lab：

Evol-Instruct：投入了大量精力重新評估了最初Evol-Instruct 方法中存在的各種問題，並對其進行了初步修改，新方法能讓各種智能體自動產生高品質的指令。
Evol-Answer：引導模型多次產生和重寫回复，可以提高其邏輯性、正確性和親和力。

AI Align AI（AAA）：

協同教學：收集WizardLM 和各種授權開源和專有的最先進模型，然後讓它們協同教學並相互提高，教學內容包括模擬聊天、品質評判、改進建議和縮小技能差距等。
Self-Teaching：WizardLM 可以透過激活學習，為監督學習產生新的進化訓練數據，為強化學習產生偏好數據。

學習：

監督學習。
階段 - DPO：為了更有效地進行離線強化學習，將優選資料分割成不同的片段，並逐級改進模型。
RLEIF：採用指令品質獎勵模型（IRM）與過程監督獎勵模型（PRM）結合的方法，使得在線上強化學習中實現更精確的正確性。

最後要說的是，任何猜測都是徒勞的，讓我們期待一下 WizardLM-2 的複出吧。

以上是「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1665

CakePHP 教程

1424

Laravel 教程

1322

PHP教程

1270

C# 教程

1249

Related knowledge

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接內存訪問技術，允許硬件設備直接與內存進行數據傳輸，不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序，實現方式因係統而異。 2)直接訪問內存可能帶來安全風險，需確保代碼的正確性和安全性。 3)DMA可提高性能，但使用不當可能導致系統性能下降。通過實踐和學習，可以掌握DMA的使用技巧，在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C 中處理高DPI顯示？ Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現：1)理解DPI和縮放，使用操作系統API獲取DPI信息並調整圖形輸出；2)處理跨平台兼容性，使用如SDL或Qt的跨平台圖形庫；3)進行性能優化，通過緩存、硬件加速和動態調整細節級別來提升性能；4)解決常見問題，如模糊文本和界面元素過小，通過正確應用DPI縮放來解決。

C 中的實時操作系統編程是什麼？ Apr 28, 2025 pm 10:15 PM

C 在實時操作系統（RTOS）編程中表現出色，提供了高效的執行效率和精確的時間管理。 1）C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2）利用面向對象特性，C 可以設計靈活的任務調度系統。 3）C 支持高效的中斷處理，但需避免動態內存分配和異常處理以保證實時性。 4）模板編程和內聯函數有助於性能優化。 5）實際應用中，C 可用於實現高效的日誌系統。

怎樣在C 中測量線程性能？ Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析，步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析，步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能，並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括：1. Binance（幣安）：提供Binance Futures量化模塊，低手續費，支持AI輔助交易。 2. OKX（歐易）：支持多賬戶管理和智能訂單路由，提供機構級風控。獨立量化策略平台有：3. 3Commas：拖拽式策略生成器，適用於多平台對沖套利。 4. Quadency：專業級算法策略庫，支持自定義風險閾值。 5. Pionex：內置16 預設策略，低交易手續費。垂直領域工具包括：6. Cryptohopper：雲端量化平台，支持150 技術指標。 7. Bitsgap：

給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

C 中的字符串流如何使用？ Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下：1.創建輸出字符串流並轉換數據，如將整數轉換為字符串。 2.應用於復雜數據結構的序列化，如將vector轉換為字符串。 3.注意性能問題，避免在處理大量數據時頻繁使用字符串流，可考慮使用std::string的append方法。 4.注意內存管理，避免頻繁創建和銷毀字符串流對象，可以重用或使用std::stringstream。

See all articles

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題