無條件免費商用的全球最長開源模型XVERSE-Long-256K
元象發布了全球首個上下文視窗長度256K的開源大模型XVERSE-Long-256K。這個模型支援輸入25萬漢字,使得大模型應用能夠進入「長文本時代」。該模型完全開源,可以無條件免費商用,並且還附帶詳細的手把手訓練教程,這讓海量的中小企業、研究者和開發者能夠更早地實現「大模型自由」。
全球主流長文本大模型圖譜
參數量和高品質資料量決定了大模型的計算複雜度,而長文本技術(Long Context)是大模型應用發展“殺手鐧”,因技術新、研發難度高,目前多為閉源付費提供。
XVERSE-Long-256K支援超長文字輸入,可用於大規模資料分析、多重文件閱讀理解、跨領域知識融合,有效提升大模型應用的深度與廣度:一、為律師、金融分析師或顧問、prompt 工程師、科研人員等解決分析處理較長文本的工作;二、在角色扮演或聊天應用中,緩解模型「忘記」之前對話的記憶力問題,或胡說八道的「幻覺」問題等等;三、更好支援智能體(AI Agent)基於歷史資訊進行規劃與決策;四、幫助AI原生應用保持連貫、個人化的使用者體驗。
至此,XVERSE-Long-256K填補了開源生態空白,還與元象此前70億、130億、650億參數大模型組成“高性能全家桶”,將國產開源提升至國際一流水平。 元像大模型系列
免費下載元像大模型
- GitHub:https://github.com/xverse- ai/XVERSE-13B
- hugging face:https://huggingface.co/xverse/XVERSE-13B-256K
- 魔搭:https://modelscope.cn/models/xverse/ XVERSE-13B-256K
- 詢問傳送:opensource@xverse.cn
使用者可登入大模型官網(chat.xverse.cn)或小程式立即體驗 XVERSE-Long -256K。
高效能定位評測表現優異
為確保業界對元像大模式有全面、客觀和長期的認知,研究者參考權威產業測評,制定了六個維度的9項綜合測評體系。 XVERSE-Long-256K 均表現出色,超越其他長文模型。
全球主流長文本開源大模型評測結果
XVERSE-Long-256K 通過了常見的長文本大模型效能壓力測試「海撈針」。該測驗在長文本語料中隱藏一個與其內容無關的句子,並透過自然語言提問讓大模型準確地提取該句子。
長篇小說 閱讀理解
#目前國內大多數大型模式只支援中英雙語,但元象支持40多種語言。我們對16萬字符的俄語經典小說《鋼鐵是如何煉成的》和41萬字符的德語歷史傳記《人類群星閃耀時》進行了測試。
《鋼鐵是如何煉成的(俄文版)》測試
《人類群星閃耀時(德文版)》測試
法律法條 精準應用
#以《中華人民共和國民法典》為例,展示對法律術語的解釋,以及對案例進行邏輯分析、結合實際的彈性應用:
《民法》測試
手把手教你訓練長文本大模型
1. 技術挑戰
- 模型訓練:GPU顯存的佔用與序列長度的平方成正比,使訓練量急遽上升。
- 模型結構:序列越長,模型的attention越分散,模型越容易忘記前序內容。
- 推理速度:模型序列越長,將大幅度降低模型推理速度。
2. 元象技術路線
# 長文本大模型技術是在近一年內發展出來的新技術,其主要技術方案為:
- 直接進行長序列的預訓練,但會導致訓練量成平方倍的提升。
- 透過位置編碼的插值或外推拓展序列長度,這種方法會降低位置編碼的分辨率,從而降低大模型輸出效果。
元象長文字大模型訓練流程
#第一階段:##ABF 繼續預訓練
- GitHub:https://github.com/xverse-ai/XVERSE-13B
- hugging face:https://huggingface.co /xverse/XVERSE-13B-256K
- 魔搭:https://modelscope.cn/models/xverse/XVERSE-13B-256K
- #詢問傳送:opensource@xverse.cn
以上是無條件免費商用的全球最長開源模型XVERSE-Long-256K的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

機器之能報道編輯:楊文誰能成為AI視訊圈的King?美劇《權力的遊戲》中,有一把「鐵王座」。傳說,它由巨龍「黑死神」熔掉數千把敵人丟棄的利劍鑄成,象徵無上的權威。為了坐上這張鐵椅,各大家族展開了一場場爭鬥和廝殺。而自Sora出現以來,AI電圈也掀起了一場轟轟烈烈的「權力的遊戲」,這場遊戲的玩家主要有大洋彼岸的RunwayGen-3、Luma,國內的快手可靈、字節即夢、智譜清影、Vidu、PixVerseV2等。今天我們就來測評一下,看看究竟誰有資格登上AI視訊圈的「鐵王座」。 -1-文生視頻
