- 方向:
- 全部 網路3.0 後端開發 web前端 資料庫 運維 開發工具 php框架 每日程式設計 微信小程式 常見問題 其他 科技 CMS教程 Java 系統教程 電腦教學 硬體教學 手機教學 軟體教學 手遊教學
- 分類:
-
- Bengio等人新作:注意力可視為RNN,新模型媲美Transformer,但超級省內存
- 序列建模的進展具有極大的影響力,因為它們在廣泛的應用中發揮重要作用,包括強化學習(例如,機器人和自動駕駛)、時間序列分類(例如,金融詐欺檢測和醫學診斷)等。在過去的幾年裡,Transformer的出現標誌著序列建模中的一個重大突破,這主要得益於Transformer提供了一種能夠利用GPU並行處理的高效能架構。然而,Transformer在推理時計算開銷很大,主要在於記憶體和運算需求呈現二次擴展,從而限制了其在低資源環境中的應用(例如,行動和嵌入式裝置)。儘管可以採用KV快取等技術來提高推理效率,但
- 人工智慧 687 2024-06-09 16:50:32
-
- 拿紗布、抓針頭,英偉達與多所大學合作,開發手術機器人
- 編輯|X英偉達(NVIDIA)正與學術研究人員合作,研究手術機器人。 NVIDIA聯合多倫多大學、加州大學柏克萊分校、蘇黎世聯邦理工學院和喬治亞理工學院的研究人員開發了ORBIT-Surgical,一個訓練機器人的模擬框架,可以提高技術團隊的技能,同時減少外科醫生的認知負擔。 ORBIT-Surgical是一種基於人工智慧的模擬框架,透過虛擬手術環境和智慧教練系統,實現了高度真實的手術模擬。醫生可以透過與這個系統互動,模擬真實手術的各種情況和複雜性。這種模擬技術不僅可以幫助訓練「受腹腔鏡手術(又
- 人工智慧 566 2024-06-09 13:23:16
-
- CLIP當RNN用入選CVPR:無需訓練即可分割無數概念|牛津大學&Google研究院
- 循環呼叫CLIP,無需額外訓練就有效分割無數概念。包括電影動漫人物,地標,品牌,和普通類別在內的任意短語。牛津大學與Google研究院聯合團隊的這項新成果,已被CVPR2024接收,並開源了程式碼。團隊提出名為CLIPasRNN(簡稱CaR)的新技術,解決了開放詞彙量影像分割領域中的幾個關鍵問題:無需訓練資料:傳統方法需要大量的掩膜註釋或圖像-文字資料集進行微調,CaR技術則無需任何額外的訓練資料即可運作。開放詞彙量的限制:預先訓練的視覺-語言模型(VLMs)在微調後,其處理開放詞彙量的能力受到限制。 C
- 人工智慧 529 2024-06-09 12:53:28
-
- 支持合成一分鐘高清視頻,華科等提出人類跳舞視頻生成新框架UniAnimate
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com人類跳舞影片產生是一項引人注目且具有挑戰性的可控影片合成任務,旨在根據輸入的參考圖像和目標姿勢序列生成高品質逼真的連續影片。隨著視訊生成技術的快速發展,特別是生成模型的迭代演化
- 人工智慧 1120 2024-06-09 11:10:58
-
- 比PID更絲滑的控制演算法&卡內基美隆大學
- MPC控制演算法,全名為ModelPredictiveControl(模型預測控制),是一種基於系統動態模型的控制技術。它的工作原理是透過數學模型預測系統的未來行為,並基於這些預測結果來優化系統的控制輸入,從而實現期望的輸出。 MPC控制演算法的核心思想是在每個控制週期內,透過對未來一段時間內的預測結果進行最佳化,以獲得最佳的控制輸入。這種最佳化是基於一些預測結果來最佳化系統的控制輸入,從而實現期望的輸出。 MPC控制演算法的應用非常廣泛,特別適用於需要滿足一些限制條件的控制系統。透過結合系統模型和優化技術,MP
- 人工智慧 880 2024-06-09 09:57:28
-
- 套殼醜聞讓史丹佛AI Lab主任怒了!抄襲團隊2人甩鍋1人失蹤、前科經歷被扒,網友:重新認識中國開源模型
- 史丹佛團隊抄襲清華系大模型事件後續來了——Llama3-V團隊承認抄襲,其中兩位來自史丹佛的大學部學生還跟另一位作者切割了。最新致歉推文,由SiddharthSharma(悉達多)和AkshGarg(阿克什)發出。不在其中、來自南加州大學的MustafaAljadery(簡稱老穆)被指是主要過錯方,並且自昨天起人就失踪了:我們希望由老穆首發聲明,但自昨天以來一直無法聯繫到他。悉達多、我(阿克什)和老穆一起發布了Llama3-V,老穆為該專案編寫了程式碼。悉達多和我的角色是幫助他在Medium和T
- 人工智慧 1352 2024-06-09 09:38:08
-
- 又被 OpenAI 截胡,Google推出開源視覺語言模型:PaliGemma
- 前言模型結合了SigLIP視覺模型和Gemma語言模型,這兩種模型都是開放組件,使得PaliGemma在處理視覺與語言結合的任務上表現出色。 PaliGemma的使用場景包括圖像字幕、圖像標籤和視覺問答等。這些應用場景利用了PaliGemma的能力來理解圖像內容並提取關鍵特徵,然後將這些資訊轉化為語言輸出,從而實現與使用者的互動或自動化內容生成。這種靈活性使得PaliGemma不僅適用於研究和開發環境,也適合商業應用,如客戶服務、內容推薦系統等。圖片PaliGemma能幹什麼圖片可以在出現提示時為
- 人工智慧 685 2024-06-09 09:17:06
-
- LightGBM實戰+隨機搜尋調參:準確率96.67%
- 大家好,我是Peter~LightGBM是經典的機器學習演算法,它的背景、原理和特點都非常值得研究。 LightGBM的演算法產生了一些特點,例如高效能、可擴展和高準確性。本文將簡要介紹LightGBM的特點、原理以及一些基於LightGBM和隨機搜尋優化的案例。 LightGBM演算法在機器學習領域,梯度提昇機(GradientBoostingMachines,GBMs)是一類強大的整合學習演算法,它們透過逐步添加弱學習器(通常是決策樹)來最小化預測誤差,從而建立一個強大的模型。 GBMs通常用於最小化預
- 人工智慧 782 2024-06-08 22:45:30
-
- Mistral 開源程式碼模型奪得王座! Codestral瘋狂訓練超80種語言,國內通義開發者請求出戰!
- 出品|51CTO技術棧(微訊號:blog51cto)Mistral發布了首個程式碼模型Codestral-22B!該模型的瘋狂之處不僅在於訓練了80多種程式語言,包括許多程式碼模型忽略的Swift等。他們的速度沒有完全一致。要求使用Go語言編寫一個「發布/訂閱」系統。這裡的GPT-4o正在輸出,Codestral已經快到看不清楚的速度交捲了!由於該模型剛剛推出,尚未公開測試。但根據Mistral的負責人說法,Codestral是目前表現最佳的開源程式碼模型。圖片有興趣的朋友可以移步:-抱抱臉:https
- 人工智慧 1278 2024-06-08 21:55:01
-
- 邁向『閉環』| PlanAgent:基於MLLM的自動駕駛閉環規劃新SOTA!
- 中科院自動化所深度強化學習團隊聯合理想汽車等提出了一種新的基於多模態大語言模型MLLM的自動駕駛閉環規劃框架—PlanAgent。此方法以場景的鳥瞰圖和基於圖的文本提示為輸入,利用多模態大語言模型的多模態理解和常識推理能力,進行從場景理解到橫向和縱向運動指令生成的層次化推理,並進一步產生規劃器所需的指令。在大規模且具有挑戰性的nuPlan基準上對該方法進行了測試,實驗表明PlanAgent在常規場景和長尾場景上都取得了最好(SOTA)性能。與常規大語言模型(LLM)方法相比,PlanAgent所
- 人工智慧 512 2024-06-08 21:30:27
-
- 模組化重構LLaVA,替換組件只需添加1-2個文件,開源TinyLLaVA Factory來了
- TinyLLaVA+計畫由清華大學電子系多媒體訊號與智慧資訊處理實驗室(MSIIP)吳及教授團隊及北京航空航天大學人工智慧學院黃雷老師團隊聯袂打造。清華大學MSIIP實驗室長期致力於智慧醫療、自然語言處理與知識發現、多模態等研究領域。北京航空團隊長期致力於深度學習、多模態、電腦視覺等研究領域。 TinyLLaVA+計畫的目標是開發一種小型跨語言智慧助手,具備語言理解、問答、對話等多模態能力。專案團隊將充分發揮各自的優勢,共同攻克技術難題,實現智慧助理的設計與開發。這將為智慧醫療、自然語言處理與知
- 人工智慧 594 2024-06-08 21:21:29
-
- 美國機器人應用遙遙落後?時隔15年,十所頂尖高校重啟「國家機器人路線圖」
- 機器人技術已經有70年的歷史了,從誕生之初就一直由美國領跑。截至2009年,美國首次發布國家機器人路線圖(NationalRoboticsRoadmap),美國在工業應用領域(如汽車、航空航太和家電等)的應用已降低到了全球第四位。自15年以後,美國在機器人技術的採用量上持續拉胯,位列全球第十,其中亞洲的機器人市場更是擴大了美國市場的5-10倍。中國則在此領域“遙遙領先”,2023年,中國大約購買了52%的銷出機器人,表明機器人技術在美國已經不再是國家級的優先事項。最近,來自加州大學、賓州
- 人工智慧 1142 2024-06-08 20:57:00
-
- MIT最新力作:以GPT-3.5解決時間序列異常檢測問題
- 今天要為大家介紹一篇MIT上週發表的文章,使用GPT-3.5-turbo解決時間序列異常檢測問題,初步驗證了LLM在時間序列異常檢測的有效性。整個過程沒有進行finetune,直接使用GPT-3.5-turbo進行異常檢測,文中的核心是如何將時間序列轉換成GPT-3.5-turbo可辨識的輸入,以及如何設計prompt或pipeline讓LLM解決異常檢測任務。下面跟大家詳細介紹一下這篇工作。圖片論文標題:Largelanguagemodelscanbezero-shotanomalydete
- 人工智慧 747 2024-06-08 18:09:01
-
- 微軟Build大會上,Fabric、PostgreSQL和Cosmos DB取得AI增強功能
- 微軟近日在Build大會上發布了約60項公告,其中包括雲端資料庫管理產品新的人工智慧功能。該公司去年推出的統一資料平台Fabric是一個主要受益者。目前處於預覽階段的工作負載開發工具包(WorkloadDevelopmentKit)可用來擴充Fabric中的應用。 FabricDataSharing是一項新功能,可跨使用者和應用程式處理即時資料。它包括一個應用程式接口,用於存取儲存在外部來源中的資料。新的自動化功能(Automation)可簡化重複性任務。整個系統未來是一種全新的RESTfu
- 人工智慧 1111 2024-06-08 17:46:24
-
- 加州大學最新! CarDreamer:全面、靈活的自動駕駛演算法測試開源平台
- 寫在前面&筆者的個人理解為了在複雜的真實世界場景中安全導航,自動駕駛汽車必須能夠足夠適應各種道路條件並預測未來事件。基於世界模型的強化學習(RL)已經成為一種有前景的方法,透過學習和預測各種環境的複雜動態來實現這一點。然而,目前並不存在一個用於在複雜駕駛環境中訓練和測試此類演算法的易於接近的平台。為了填補這一空白,這裡介紹了CarDreamer,第一個專為開發和評估基於世界模型的自動駕駛演算法設計的開源學習平台。它包含三個關鍵組成部分:1%)世界模型(WM)主幹:CarDreamer整合了一些
- 人工智慧 1250 2024-06-08 16:57:52