7262篇提交,ICLR 2024爆火,兩篇國內論文獲傑出論文提名
今年共選出 5 篇傑出論文獎以及 11 篇榮譽提名。
ICLR全稱為國際學習表徵會議(International Conference on Learning Representations),今年是第十二屆會議,於5月7日至11日在奧地利維也納舉辦。
在機器學習社群中,ICLR 是較為「年輕」的頂尖學術會議,它由深度學習巨頭、圖靈獎得主Yoshua Bengio 和 Yann LeCun 主辦,2013年才剛舉辦第一屆。不過 ICLR 很快就獲得了學術研究者們的廣泛認可,被認為是深度學習的頂級學術會議。
本屆會議共收到了 7262 篇提交論文,接收 2260 篇,整體接收率約為 31%,與去年持平(31.8%)。 此外 Spotlights 論文比例為 5%,Oral 論文比例為 1.2%。
比比起於往年,無論是參加人數或論文提交量,ICLR 的熱度可以說是有極大的提升。
歷屆ICLR 論文數據圖
在近日公佈的獲獎論文中,大會評選出了5 篇傑出論文獎和11 篇榮譽提名獎。
5 篇傑出論文獎
Outstanding Paper winners
論文:Generalization in diffusion models arises from geometry -adaptive harmonic representations
#論文網址:https://openreview.net/pdf?id=ANvmVS2Yr0
機構:紐約大學、法蘭西公學院
作者:Zahra Kadkhodaie 、Florentin Guth 、Eero P. Simoncelli 、Stéphane Mallat
本文對影像擴散模型的泛化和記憶方面進行了重要的深入分析。作者透過實證研究了影像生成模型何時從記憶輸入切換到泛化模式,並透過幾何自適應諧波表示與諧波分析的想法建立聯繫,從架構歸納偏差的角度進一步解釋了這一現象。本文涵蓋了我們對視覺生成模型理解中缺少的關鍵部分,對未來研究啟發巨大。
論文:Learning Interactive Real-World Simulators
- 論文網址:https://openreview. net/forum?id=sFyTZEqmUY
- 機構:UC 柏克萊、 Google DeepMind 、 MIT 、阿爾伯塔大學
跨多個來源聚合資料以訓練機器人基礎模型是長期目標。由於不同的機器人具有不同的感知運動接口,這給跨大規模資料集的訓練帶來了重大挑戰。
UniSim
,是朝著這個方向邁出的重要一步,也是一項工程壯舉,它利用了基於視覺感知和控制的文本描述的統一接口來聚合數據,並透過利用視覺和語言領域的最新發展來訓練機器人模擬器。 總結而言,本文探討了透過產生模型學習真實世界互動的通用模擬器 UniSim,邁出了建立通用模擬器的第一步。例如 UniSim 可以透過模擬「打開抽屜」等高階指令和低階指令的視覺結果來模擬人類和智慧體如何與世界互動。 ######本文將大量數據(包括網路文字 - 影像對,來自導航、人類活動、機器人動作等的豐富數據,以及來自模擬和渲染的數據)結合到一個條件影片生成框架中。然後透過仔細編排沿著不同軸的豐富數據,本文表明 UniSim 可以成功地合併不同軸數據的經驗並泛化到數據之外,透過對靜態場景和物件的細粒度運動控制來實現豐富的互動。 ###如下圖3 所示,UniSim 能夠模擬一系列豐富動作,例如廚房場景中洗手、拿碗、切胡蘿蔔、擦乾手這一系列動作;圖3 右上是按下不同的開關;圖3 下是兩個導航場景。
對應上圖3 右下的導航場景
上圖3 右下方的導航情境
Sue
- ##論文網址:https://openreview.net/forum?id=PdaPky8MUn
- 機構:特拉維夫大學、IBM
- 作者:Ido Amos、Jonathan Berant、Ankit Gupta
論文:Protein Discovery with Discrete Walk-Jump Sampling
- 論文網址:https:// openreview.net/forum?id=zMPHKOmQNb
- #機構:基因泰克、紐約大學
- 作者:Nathan C. Frey、Dan Berenberg、 Karina Zadorozhny、Joseph Kleinhenz、Julien Lafrance-Vanasse、Isidro Hotzel、Yan Wu、Stephen Ra、Richard Bonneau、Kyunghyun Cho、Andreas Loukas、Vladimir Gligorijevic、Saeed Saremi
論文:Vision Transformers Need Registers
- #論文網址:https://openreview.net/ forum?id=2dnO3LLiJ1
- 機構:Meta 等 ##作者:Timothée Darcet、Maxime Oquab、Julien Mairal、Piotr Bojanowski
- 這篇論文辨識了vision transformer 網路的特徵圖中的人工痕跡,這些痕跡以低資訊背景區域中的高範數tokens 為特徵。
作者提出了這種現象發生的關鍵假設,並提供了一個簡單而優雅的解決方案,使用額外的 register tokens 來解決這些痕跡,從而增強了模型在各種任務上的性能。從這項工作中獲得的見解還可以影響其他應用領域。
這篇論文行文極佳,為進行研究提供了一個很好的示範:「辨識問題,理解其發生的原因,然後提出解決方案。」
11篇榮譽提名除了5 篇傑出論文,ICLR 2024 也選出了11 篇榮譽提名獎。
論文:Amortizing intractable inference in large language models
- 機構:蒙特利爾大學、牛津大學
- #作者:Edward J Hu、Moksh Jain、Eric Elmoznino、Younesse Kaddar、Guillaume Lajoie、Yoshua Bengio、Nikolay Malkin
- 論文地址:https://openreview.net/forum? id=Ouj6p4ca60
- 這篇論文從貝葉斯推理的角度提出了一種在大型語言模型中替代自回歸解碼的有前景的方法,這可能會激發後續研究。
- 機構:DeepMind
- #作者:Ian Gemp、Luke Marris、Georgios Piliouras
- #論文網址:https://openreview.net/forum?id=cc8h3I3V4E
- #這是一篇寫得非常清晰的論文,對解決開發高效且可擴展的納許求解器這一重要問題意義重大。
論文:Beyond Weisfeiler-Lehman: A Quantitative Framework for GNN Expressiveness
機構:北京大學、北京智源人工智慧研究院
作者:張博航蓋景初杜逸恆葉啟威賀笛王立威
論文網址:https://openreview.net/forum?id=HSKaGOi7Ar
GNN 的表達能力是一個重要課題,而目前的解決方案仍然存在很大的限制。作者提出了一個基於同態計數的新表達理論(expressivity theory)。
論文:Flow Matching on General Geometries
#機構:Meta
- ##作者:Ricky T. Q. Chen、Yaron Lipman
- 論文地址:https://openreview.net/forum?id=g7ohDlTITL ##本文探討了在一般幾何在流形上進行生成建模這一具有挑戰性但又十分重要的問題,並提出了一個實用且高效的演算法。本文的呈現非常出色,並在廣泛的任務上進行了全面的實驗驗證。
- # 機構:中佛羅裡達大學、 Google DeepMind、阿姆斯特丹大學等
- 作者:Shashanka Venkataramanan、Mamshad Nayeem Rizve、Joao Carreira、Yuki M Asano、Yannis Avrithis
- 論文地址:https: //openreview.net/forum?id=Yen1lGns2o
- #本文提出了一種新穎的自監督圖像預訓練方法,即透過從連續視訊中學習。本文既貢獻了新類型的數據,也貢獻了一種從新數據中學習的方法。
- # 機構:香港城市大學、騰訊AI 實驗室、西安交通大學等
- 作者:Yichen Wu、Long-Kai Huang、Renzhen Wang、Deyu Meng、魏穎(Ying Wei)
- #論文地址:https://openreview.net/forum?id=TpD2aG1h0D
- #作者提出了一種新的元連續學習方差減少方法。此方法表現良好,不僅具有實際影響,而且還得到了 regret 分析的支持。
- 機構:伊利諾大學厄巴納-香檳分校、微軟
- 作者:Suyu Ge、Yunan Zhang、Liyuan Liu、Minjia Zhang、Jiawei Han、Jianfeng Gao
- 論文地址:https:/ /openreview.net/forum?id=uNrFpDPMyo
- #本文針對KV 快取壓縮問題(該問題對基於Transformer 的LLM 影響很大),透過一個簡單的想法來減少內存,並且無需耗費大量資源進行微調或重新訓練即可部署。這種方法非常簡單,事實證明它非常有效。
- 機構:史丹佛大學、哥倫比亞大學
- 作者:Yonatan Oren、Nicole Meister、Niladri S. Chatterji、Faisal Ladhak、Tatsunori Hashimoto
- 論文地址:https://openreview.net/forum?id= KS8mIvetg2
論文:Robust agents learn causal world models
- 機構:Google DeepMind
- 作者: Jonathan Richens、Tom Everitt
- 論文網址:https://openreview.net/forum?id=pOoKI3ouv1 ##這篇論文在奠定理論基礎方面取得了長足進展,以便理解因果推理在智能體推廣到新領域的能力中所起到的作用,對一系列相關領域也產生了影響。
- #機構:普林斯頓大學、哈佛大學等
- 作者:Gautam Reddy
- #論文網址:https://openreview.net/forum?id=aN4Jf6Cx69
機構:Granica Computing
######## ##作者:Germain Kolossov、Andrea Montanari、Pulkit Tandon#############論文網址:https://openreview.net/forum?id=HhfcNgQn6p########### ##這篇論文為資料子集選擇建立了統計基礎,並確定了流行的資料選擇方法的缺點。 ############參考連結:https://blog.iclr.cc/2024/05/06/iclr-2024-outstanding-paper-awards/##########以上是7262篇提交,ICLR 2024爆火,兩篇國內論文獲傑出論文提名的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为
