- 方向:
- 全部 網路3.0 後端開發 web前端 資料庫 運維 開發工具 php框架 每日程式設計 微信小程式 常見問題 其他 科技 CMS教程 Java 系統教程 電腦教學 硬體教學 手機教學 軟體教學 手遊教學
- 分類:
-
- 單卡A100實現百萬token推理,速度快10倍,這是微軟官方的大模型推理加速
- 微軟的研究讓開發者可以在單卡機器上以10倍的速度處理超過1M的輸入文字。大型語言模型(LLM)已進入長上下文處理時代,其支援的上下文視窗從先前的128K激增到10Mtoken等級。然而,由於注意力機制的二次複雜度,模型處理輸入提示(即預填充階段)並開始產生第一個token可能需要幾分鐘。導致首個token生成的時間過長,從而嚴重影響了用戶體驗,這也大大限制了長上下文LLM的廣泛應用。舉例來說(如圖2a所示),在單台裝有A100的機器上為LLaMA-3-8B提供服務時,如果提示有30萬個
- 人工智慧 825 2024-07-12 17:14:05
-
- 達摩院發表一站式AI影片創作平台\'尋光\',打造全新AI工作流程
- 今年是AI影片生成爆發的元年,以Sora為代表的演算法模型和產品應用不斷湧現。短短幾個月內,我們目睹了數十種影片產生工具的問世,基於AI的影片創作方式開始流行起來。但新技術也引發更多的挑戰與質疑,除了大家熟知的「開盲盒」現象,AI所產生的視訊內容也因可控性差、處理工作流程繁瑣而頻頻被詬病。 OpenAI曾經邀請專業影片製作團隊對Sora進行了測試,其中來自於多倫多的ShyKids團隊,利用Sora製作了一個氣球人主題的短片,把創意和AI技術進行了完美的結合,讓人印象深刻。整部短片其實並不
- 人工智慧 974 2024-07-12 16:24:20
-
- ICLR 2024 Spotlight | 無懼中間步驟,MUSTARD可產生高品質數學推理數據
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。近年來,大型語言模型(LLM)在數學應用題和數學定理證明等任務中取得了長足的進展。數學推理需要嚴格的、形式化的多步驟推理過程,因此是LLMs推理能力進步的關鍵里程碑,但仍面臨
- 人工智慧 1103 2024-07-12 16:07:14
-
- HANDS@ECCV24 手部研討會和挑戰賽,誠摯邀請投稿和參與競賽
- 簡介第八屆HANDS將在ECCV24(9月30日下午,米蘭)舉辦,包含研討會和挑戰賽。 HANDS將為相關手部研究人員和實務工作者提供一個分享工作和討論潛在合作的平台。過去7屆HANDS也取得了極大的成功。本文檔屬於翻譯,資訊以官網為準。 HANDS@ECCV24首頁:https://hands-workshop.org/手部研討會與投稿:研討會專注於手部相關方向,將邀請手部相關領域的專家做前沿報告。特別的,我們誠摯邀請相關長文投稿。手部挑戰賽:挑戰賽基於最新的手部大數據集AssemblyHands、ARC
- 人工智慧 1038 2024-07-12 14:12:10
-
- DALL-E 3 現在有整合編輯工具,但仍需要改進
- 是否曾經想立即編輯您的 DALL-E 3 作品,但不知道如何進行更改? OpenAI 傾聽您的聲音,並在 ChatGPT 中的 DALL-E 3 中添加了內嵌編輯工具,讓您無需離開應用程式即可對您的創作進行調整。 這
- 人工智慧 769 2024-07-12 14:10:52
-
- 開源3D醫學大模型SAT,支援497類器官,效能超越72個nnU-Nets,上交大團隊發布
- 作者|上海交通大學、上海人工智慧實驗室編輯|ScienceAI近日,上海交通大學與上海人工智慧實驗室聯合團隊發布3D醫學影像分割大模型SAT(SegmentAnythinginradiologyscans,drivenbyTextprompts),在3D醫學圖像(CT、MR、 PET)上,基於文字提示實現人體497種器官/病灶的通用分割。所有資料和程式碼、模型均已開源。論文連結:https://arxiv.org/abs/2312.17183程式碼連結:https://github.com/zhao
- 人工智慧 623 2024-07-12 10:52:01
-
- 幾分鐘產生四維內容,還能控制運動效果:北大、密西根提出DG4D
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者潘亮博士目前是上海人工智慧實驗室的ResearchScientist。在此之前,在2020年至2023年,他於新加坡南洋理工大學S-Lab擔任ResearchFellow,
- 人工智慧 1160 2024-07-12 09:30:21
-
- 陶哲軒支持! AI數學奧林匹克競賽進步獎公佈,獎金100多萬美元
- 大模型做數學題到底如何,不妨讓它參與這種級別的比賽。 「AI數學奧林匹克競賽(AIMO進步獎)的初步成績已公佈。根據排行榜的數據,目前看來,獲勝的程序在私人測試中正確回答了29/50題,這一成績比預期的要高。 AIMO起源於機器學習量化交易的非銀行金融機構XTXMarkets,主要讓參與者使用AI模型解決國際數學難題,而此次進步獎的目標是創建能夠解決用LaTeX格式編寫的複雜數學問題的演算法和模型。這有助於推動人工智慧模型的數學推理能力,推動前沿知識的發
- 人工智慧 832 2024-07-12 08:22:13
-
- 揭秘:階躍星辰萬億MoE+多模態大模型矩陣亮相
- 在2024年世界人工智慧大會的現場,很多人在一個攤位前排隊,只為讓AI大模型給自己在天庭「安排」一個差事。流程:提供個人照片生成仙界形象照(參考《大鬧天宮》畫風)互動式劇情選擇和交談環節基於選擇和回答評估MBTI人格類型根據人格類型"安排"天庭差事體驗方式:現場排隊在線體驗(掃描下方二維碼)大模型創業公司階躍星辰公佈大招與上影合作的AI互動體驗《AI+大鬧天宮》只是階躍星辰展示大模型魅力的開胃菜。在WAIC期間,他們隆重推出了以下大招:萬億參數MoE大模型:Step-2正式版
- 人工智慧 1167 2024-07-12 05:52:58
-
- ACL 2024 | 引領學術視聽研究,上海交大、清華大學、劍橋大學、上海AILAB聯合發布學術視聽資料集M3AV
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者來自上海交通大學,清華大學,劍橋大學和上海人工智慧實驗室。一作陳哲為上海交通大學博一學生,師從上海交通大學人工智慧學院王缽教授。通訊作者為王缽教授(首頁:https:/
- 人工智慧 1199 2024-07-12 04:11:47
-
- 上交大洪亮課題組&上海AI實驗室團隊發布FSFP,基於語言模型的蛋白質功能小樣本預測方法,登Nature子刊
- 編輯|ScienceAI近日,上海交通大學自然科學研究院/物理天文學院/張江高研院/藥學院洪亮教授課題組,聯合上海人工智慧實驗室青年研究員談攀,在蛋白質突變-性質預測上取得重要突破。這項工作採用全新的訓練策略,在使用極少濕實驗數據的情況下,大大提高了傳統蛋白質預訓練大模型在突變-性質預測的效果。研究成果以《Enhancingtheefficiencyofproteinlanguagemodelswithminimalwet-labdatathroughfew-shotlearning》為題,於
- 人工智慧 1049 2024-07-11 20:10:28
-
- 智加科技論文DualBEV入選電腦視覺頂會ECCV
- 近日,智加科技團隊論文《DualBEV:UnifyingDualVeiwTransformationwithProbabilisticCorrespondences》入選歐洲電腦視覺國際會議(ECCV,EuropeanConferenceonComputerVision),ECCV是電腦視覺領域最具影響力與權威性的國際會議之一,與國際電腦視覺大會(ICCV)和電腦視覺與模式識別會議(CVPR)齊名,被譽為電腦視覺領域的「三大頂會」之一。 ECCV每兩年舉辦一次,匯聚了全球頂
- 人工智慧 614 2024-07-11 18:12:18
-
- 像生物網路一樣「生長」,具備「結構可塑性」的自組織神經網路來了
- 生物神經網路有一個重要的特徵是高度可塑性,這使得自然生物體具有卓越的適應性,而這種能力會影響神經系統的突觸強度和拓撲結構。然而,人工神經網路主要被設計為靜態的、完全連接的結構,在面對不斷變化的環境和新的輸入時可能非常脆弱。儘管研究人員對線上學習和元學習進行了大量研究,但目前最先進的神經網路系統仍然使用離線學習,因為這與反向傳播結合使用時更加簡單。那麼,人工神經網路是否也能擁有類似高度可塑性的性質?來自哥本哈根資訊科技大學的研究團隊提出了一種自組織神經網路—LNDP,能夠以活動
- 人工智慧 1240 2024-07-11 17:19:10
-
- 分子100%有效,從頭設計配體,湖南大學提出以片段為基礎的分子表徵框架
- 編輯|KX分子描述子的應用與挑戰分子描述子廣泛應用於分子建模。然而,在AI輔助分子發現領域,缺乏自然適用、完整且原始的分子表徵,影響模型性能和可解釋性。 t-SMILES框架的提出基於片段的多尺度分子表徵框架t-SMILES解決分子表徵問題。此框架使用SMILES類型的字串描述分子,支援序列模型作為生成模型。 t-SMILES的程式碼演算法t-SMILES有三種程式碼演算法:TSSA、TSDY和TSID。實驗結果實驗表明,t-SMILES模型生成分子具有100%理論有效性和高新穎性,優於基於SOTASM
- 人工智慧 646 2024-07-11 16:12:59
-
- 國內首個!商湯科技發表'日日新5o”,即時多模態串流互動對標GPT-4o
- 2024年7月5日,上海-2024世界人工智慧大會暨人工智慧全球治理高階會議(WAIC2024)策略夥伴商湯科技舉辦「大愛無疆・向新力」人工智慧論壇,發布國內首所參見即所得模型“日日新5o”,互動體驗對標GPT-4o,實現全新AI互動模式。透過整合跨模態訊息,基於聲音、文字、圖像和視訊等多種形式,國內首個所見即所得模型「日日新5o」帶來一種全新的AI互動模式,即即時的串流多模態交互作用。現場也為大家展示了這
- 人工智慧 1129 2024-07-11 15:52:55