- 方向:
- 全部 網路3.0 後端開發 web前端 資料庫 運維 開發工具 php框架 每日程式設計 微信小程式 常見問題 其他 科技 CMS教程 Java 系統教程 電腦教學 硬體教學 手機教學 軟體教學 手遊教學
- 分類:
-
- 從裸機到700億參數大模型,這裡有一個教程,還有現成可用的腳本
- 我們知道LLM是在大規模電腦叢集上使用海量資料訓練得到的,本站曾介紹過不少用於輔助和改進LLM訓練流程的方法和技術。而今天,我們要分享的是一篇深入技術底層的文章,介紹如何將一堆連作業系統也沒有的「裸機」變成用來訓練LLM的電腦叢集。這篇文章來自於AI新創公司Imbue,該公司致力於透過理解機器的思維方式來實現通用智慧。當然,將一堆連作業系統也沒有的「裸機」變成用於訓練LLM的電腦叢集並不是一個輕鬆的過程,充滿了探索和試錯,但Imbue最終成功訓練了一個700億參數的LLM,並在此過程中積累
- 人工智慧 783 2024-07-24 20:13:31
-
- 擊敗GPT-4o的開源模型如何煉成?關於Llama 3.1 405B,Meta都寫在這篇論文裡了
- 在經歷了提前兩天的「意外洩漏」之後,Llama3.1終於在昨夜由官方正式發布了。 Llama3.1將上下文長度擴展到了128K,擁有8B、70B和405B三個版本,再次以一已之力抬高了大模型賽道的競爭標準。對AI社群來說,Llama3.1405B最重要的意義是刷新了開源基礎模型的能力上限,Meta官方稱,在一系列任務中,其性能可與最好的閉源模型相媲美。下表展示了目前Llama3系列模型在關鍵基準測試上的表現。可以看出,405B模型的表現與GPT-4o十分接近。同時,Meta公佈了《TheLlam
- 人工智慧 1085 2024-07-24 18:42:03
-
- 性能強11倍,喬治亞理工學院、清華團隊用AI輔助發現儲能新材料,登Nature子刊
- 編輯|蘿蔔皮靜電電容器是國防、航空、能源和交通領域先進電力系統中的關鍵儲能元件。能量密度是靜電電容器的品質因數,主要由介電材料的選擇決定。大多數工業級聚合物介電材料都是柔性聚烯烴或剛性芳香族化合物,具有高能量密度或高熱穩定性,但不能同時具有這兩種特性。在這裡,喬治亞理工學院(GeorgiaInstituteofTechnology)、康乃狄克大學(UniversityofConnecticut)以及清華大學的研究團隊利用人工智慧(AI)、聚合物化學和分子工程,來發現聚降冰片烯和聚醯亞胺系列中的一系
- 人工智慧 447 2024-07-24 17:42:52
-
- 神經網路也有空間意識!學習在Minecraft創建地圖,登上Nature子刊
- 這是人類首次證明神經網路可以創造自己的地圖。想像一下,你身處一個陌生的小鎮,即使一開始周圍的環境並不熟悉,你也可以四處探索,並最終在大腦中繪製出一張環境地圖,裡麵包含建築物、街道、標誌等相互之間的位置關係。這種在大腦中建立空間地圖的能力是人類更高級認知類型的基礎:例如,有理論認為,語言是由大腦中類似地圖的結構編碼的。然而,即使是最先進的人工智慧和神經網絡,也無法憑空建構這樣的地圖。計算生物學助理教授、HeritageMedical研究所研究員MattThomson說:「有一種感覺是,即使是最先進
- 人工智慧 701 2024-07-24 09:38:12
-
- 首個超越GPT4o級開源模型! Llama 3.1洩密:4050億參數,下載連結、模型卡都有了
- 快準備好你的GPU! Llama3.1終於現身了,不過出處卻不是Meta官方。今日,Reddit上新版Llama大模型洩漏的消息遭到了瘋傳,除了基礎模型,還包括8B、70B和最大參數的405B的基準測試結果。下圖為Llama3.1各版本與OpenAIGPT-4o、Llama38B/70B的比較結果。可以看到,即使是70B的版本,也在多項基準上超過了GPT-4o。圖源:https://x.com/mattshumer_/status/1815444612414087294顯然,3.1版本的8B和70
- 人工智慧 1295 2024-07-23 20:51:33
-
- ECCV 2024|盲影片去閃爍通用方法BlazeBVD來了,美圖&國科大聯合提出
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近年,短視頻生態的賽道迅猛崛起,圍繞短視頻而生的創作編輯工具在不斷湧現,美圖公司旗下專業手機視頻編輯工具——Wink ,憑藉獨創的影片畫質修復能力獨佔鰲頭,海內外用
- 人工智慧 438 2024-07-23 15:13:34
-
- 小米投資的具身智慧機器人公司和焊接巨頭官宣策略合作
- 近期,小米集团投资的首个具身智能企业“小雨智造”,与行业巨头松下的合资公司唐山松下达成重大战略合作,旨在共同开发先进的大模型智能焊接机器人。7月18日,唐山松下产业机器人有限公司(下称“唐山松下”)与北京小雨智造科技有限公司(下称“小雨智造”)的战略合作签约仪式在唐山松下总部圆满完成。松下产业机器有限公司总经理桥山祐一郎、执行副总经理柳铮,小雨智造创始人兼CEO乔忠良、联合创始人兼副总裁李川等领导共同出席了签约仪式,双方均对本次合作寄
- 人工智慧 476 2024-07-23 14:50:54
-
- 無限生成視頻,還能規劃決策,擴散強制整合下一token預測與全序列擴散
- 目前,採用下一token預測範式的自回歸大型語言模型已經風靡全球,同時互聯網上的大量合成圖像和視頻也早已讓我們見識到了擴散模型的強大之處。近日,MITCSAIL的一個研究團隊(一作為MIT在讀博士陳博遠)成功地將全序列擴散模型與下一token模型的強大能力統合到了一起,提出了一種訓練和採樣範式:DiffusionForcing(DF)。論文標題:DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion論文地址:https:/
- 人工智慧 1164 2024-07-23 14:05:21
-
- 繼「阿里星」後,阿里淘天重啟頂尖技術人才招聘,百萬年薪是標配
- 7月22日,阿里巴巴淘天集團的「頂尖人才T-Star計畫「正式啟動。該計畫延攬全球前沿技術領域的競賽、學術和實戰高手,為這些「天才少年」提供頂尖技術課題、算力資源、研發平台資源,和百萬年薪起步、「大牛主管」專屬培養的頂尖成長空間。記者了解到,T-Star計畫是「阿里星」計畫的延續,「阿里星」起源於2011年,吸引最年輕最頂尖的技術人才加入是它的宗旨。過往招募進來的大多是博士,獲得副總裁級
- 人工智慧 900 2024-07-22 21:20:23
-
- ICML 2024 Oral | DPO是否比PPO更適合LLM,清華吳翼團隊最新揭秘
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com吳翼,清華大學交叉資訊院助理教授,曾任OpenAI全職研究員,研究領域為強化學習,大模型對齊,人機交互,機器人學習等。 2019年於美國加州大學柏克萊分校取得博士學位,師承Stu
- 人工智慧 402 2024-07-22 18:41:23
-
- AI影像新標準,僅1%原始資料可達最佳效能,通用醫學基礎模型登Nature子刊
- 編輯|白菜葉經過大規模預訓練的基礎模型已在非醫學領域取得了巨大成功。然而,訓練這些模型通常需要大量全面的資料集,這與生物醫學影像中常見的較小且更專業的資料集形成鮮明對比。德國弗勞恩霍夫數位醫學研究所(FraunhoferInstituteforDigitalMedicineMEVIS)的研究人員提出了多任務學習策略,將訓練任務數量與記憶體需求分開。他們在多任務資料庫(包括斷層掃描、顯微鏡和X光影像)上訓練了一個通用生物醫學預訓練模型(UMedPT),並採用了各種標記策略,例如分類、分割和
- 人工智慧 1061 2024-07-22 17:38:00
-
- ECCV 2024 | 提升GPT-4V、Gemini偵測任務效能,你需要這個提示範式
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者來自浙江大學、上海人工智慧實驗室、香港中文大學、雪梨大學和牛津大學。作者名單:吳逸璇,王逸舟,唐詩翔,吳文灝,賀通,WanliOuyang,PhilipTorr,Jia
- 人工智慧 605 2024-07-22 17:28:30
-
- KDD 2024|港大黃超團隊深度解析大模型在圖機器學習領域的「未知邊界」
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的主要作者來自香港大學的資料智慧實驗室(DataIntelligenceLab)。作者中,第一作者任旭濱和第二作者湯嘉斌都是香港大學數據科學院的一年級博士生,指導老師為Da
- 人工智慧 1194 2024-07-22 16:54:34
-
- 中科大聯合華為諾亞提出Entropy Law,揭秘大模型效能、資料壓縮率以及訓練損失關係
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本工作由中科大認知智慧全國重點實驗室IEEEFellow陳恩紅團隊與華為諾亞方舟實驗室完成。陳恩紅教授團隊深耕資料探勘、機器學習領域,在頂尖期刊與會議發表多篇論文,Google學術論
- 人工智慧 837 2024-07-22 16:39:35
-
- 權重、程式碼、資料集全開源,效能超越Mistral-7B,蘋果小模型來了
- 小模型成趨勢?本週,OpenAI上線小模型GPT-4o-mini,小模型賽道正式開卷。近期加入這一賽道的還有蘋果。最近,蘋果公司作為DataComp-LM(DCLM)專案的研究機構之一,在HuggingFace上發布了DCLM-7B開源模型。該模型性能已經超越了Mistral-7B,並且正在逼近其他領先的開源模型,包括Llama3和Gemma。論文連結:https://arxiv.org/pdf/2406.11794專案連結:https://huggingface.co/apple/DCLM-7
- 人工智慧 515 2024-07-22 16:18:40