基於LLaMA卻改張量名,李開復公司大模型引爭議,官方回應來了
前段時間,開源大模型領域迎來了一個新的模型 —— 上下文視窗大小突破 200k,能一次處理 40 萬漢字的「Yi」。
創新工場董事長兼CEO 李開復創立了大模型公司「零一萬物」,並且建構了這個大模型,其中包括了Yi-6B 和Yi-34B 兩個版本
根據Hugging Face 英文開源社群平台和C-Eval 中文評測榜單,Yi-34B 推出時取得了多項SOTA 國際最佳性能指標認可,成為全球開源大模型「雙料冠軍」,擊敗了LLaMA2 和Falcon 等開源競品。
Yi-34B 也成為當時唯一成功登頂Hugging Face 全球開源模型排行榜的國產模型,稱「全球最強開源模型」。
發布後,這個模型吸引了許多國內外的研究人員和開發者的關注
但最近,有研究者發現, Yi-34B 模型基本上採用了LLaMA 的架構,只是重新命名了兩個張量。
請點選此連結查看原貼:https://news.ycombinator.com/item?id=38258015
#貼文中也提到:
Yi-34B 的程式碼其實是LLaMA 程式碼的一次重構,但看似並未做出任何實質改變。這個模型明顯是基於原始Apache 2.0 版的LLaMA 檔案進行的編輯,但卻未提及LLaMA:
Yi vs LLaMA代碼對比。程式碼連結:https://www.diffchecker.com/bJTqkvmQ/
此外,這些程式碼變更並沒有透過Pull Request 的方式提交到transformers 專案中,而是以外部程式碼的形式附加上去,這可能存在安全風險或不被框架所支援。 HuggingFace 排行榜甚至不會對這個上下文視窗最高可達 200K 的模型進行基準測試,因為它沒有自訂程式碼策略。
他們聲稱這是32K 模型,但它被配置為4K 模型,沒有RoPE 伸縮配置,也沒有解釋如何伸縮(註:零一萬物之前表示模型本身在4K 的序列上進行訓練,但是在推理階段可以擴展到32K)。目前,關於其微調數據的資訊為零。他們也沒有提供復現他們的基準測試的說明,包括可疑的 MMLU 高分。
任何在人工智慧領域工作過一段時間的人都不會對此視而不見。這是虛假宣傳嗎?違反許可證規定嗎?實際上是作弊了基準測試嗎?誰在乎呢?我們可以換一篇論文,或者在這種情況下,拿走所有創投的錢。至少Yi在標準之上,因為它是一個基礎模型,而且性能確實不錯
在數天前,在Huggingface 社區中,有開發者也指出:
根據我們的了解,除了重新命名兩個張量之外,Yi 完全採用了LLaMA 的架構。 (input_layernorm, post_attention_layernorm)
在討論中,一些網友表示:如果他們要確切地使用Meta LLaMA的架構、程式碼庫和其他相關資源,就必須遵守LLaMA規定的授權協議
為了遵守LLaMA 的開源協議,一位開發者決定將自己的名字改回,並重新發布到huggingface 上
01-ai/Yi-34B,張量已重新命名以符合標準LLaMA 模型代碼。相關連結:https://huggingface.co/chargoddard/Yi-34B-LLaMA
透過閱讀這段內容,我們可以推論出賈揚清離開阿里並開始創業的消息是前幾天在他的朋友圈中提到的
對於這件事,機器之心也向零一萬物進行了求證。零一萬物回應說:
GPT 是一個業界公認的成熟架構,LLaMA 在 GPT 上做了總結。零一萬物研發大模型的結構設計基於GPT 成熟結構,借鑒了行業頂尖水平的公開成果,同時基於零一萬物團隊對模型和訓練的理解做了大量工作,這是我們首次發布獲得優秀結果的地基之一。同時,零一萬物也持續探索模型結構層面本質上的突破。
模型結構僅是模型訓練其中一部分。 Yi 開源模型在其他方面的精力,例如資料工程、訓練方法、baby sitting(訓練過程監測)的技巧、hyperparameter 設定、評估方法以及對評估指標的本質理解深度、對模型泛化能力的原理的研究深度、業界頂尖的AI Infra 能力等,投入了大量研發打底工作,這些工作往往比起基本結構能起到更大的作用跟價值,這些也是零一萬物在大模型預訓練階段的核心技術護城河。
在進行大量的訓練實驗過程中,我們根據實驗執行的需求對程式碼進行了改名。我們非常重視開源社群的回饋,並對程式碼進行了更新,以更好地融入Transformer生態系統
我們非常感謝社群的回饋,我們在開源社群剛剛起步,希望和大家攜手共創社區繁榮,易開源將會盡力持續進步
以上是基於LLaMA卻改張量名,李開復公司大模型引爭議,官方回應來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

目前排名前十的虛擬幣交易所:1.幣安,2. OKX,3. Gate.io,4。幣庫,5。海妖,6。火幣全球站,7.拜比特,8.庫幣,9.比特幣,10。比特戳。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron
