史丹佛2023 AI指數報告出爐!中國霸榜AI頂會,中科院論文發表量世界第一
今天,史丹佛發布了2023年AI指數報告。
值得注意的是,史丹佛AI指數報告列出了「AI論文發表量」世界前十名的機構,9所全部來自中國,紛紛追趕MIT。
它們分別是:中國科學院、清華大學、中國科學院大學、上海交通大學、浙江大學、哈爾濱工業大學、北京航空航天大學、電子科技大學、北京大學、以及MIT。
今年的報告主要分為八大節:研究與發展,技術表現,人工智慧技術倫理,經濟,教育,政策和治理,多元,以及公眾觀點。
以下內容提取了報告幾項要點。
兩國論文合作全球居首
從2010年-2021年,儘管AI論文跨國合作的步伐已經放緩,但是自2010年以來,美國和中國的人工智慧研究合作數量增加了約4倍,比中國和英國合作總數多2.5倍。
然而,從2020年-2021年,兩國合作的總數僅增長了2.1%,是自2010年以來的最小同比增長率。
此外,人工智慧論文的總數自2010年以來翻了一番以上。從2010年的20萬篇成長到2021年的近50萬篇(49601)。
就AI論文發表的類型來看, 2021 年,所有已發表的AI論文中有60%是期刊文章,17%是會議論文,13%來自儲存庫。
雖然在過去12年中期刊和儲存庫論文分別增加了3倍和26.6倍,但會議論文的數量自2019年以來有所下降。
模式辨識、機器學習和電腦視覺依舊是人工智慧領域研究的熱門話題。
中國在期刊、會議和儲存庫論文總量方面依舊處於領先地位。
美國在人工智慧會議和儲存庫引用方面仍然領先,但這些領先優勢正被慢慢削弱。儘管如此,世界上大多數的大型語言模型和多模態模型(2022年54%)是由美國機構產生的。
中國霸榜AI頂會,但引用量低於美國
AI期刊論文的發表,中國始終保持領先地位,2021年為39.8%,其次是歐盟和英國(15.1%),然後是美國(10.0%)。
自2010年以來,中國人工智慧期刊論文被引頻次佔比逐步上升,歐盟、英國、美國均下降。中國、歐盟和英國、美國佔全球總引用量的65.7%。
那麼,世界頂會論文發表的情況又如何?
2021年,中國以26.15%的比例在全球AI頂會發表的論文數量所佔份額最大,而歐盟和英國以20.29%緊隨其後,美國以17.23 %位居第三。
從頂會論文引用量來看,中國雖然高產,但引用量相較於美國來說較低。美國頂會論文引用量23.9%,中國為22.02%。
從側面可以看出,中國論文發表數量最多,但品質不如美國高。
在AI論文儲存庫提交方面,美國在世界居首,23.48%。中國最低,11.87%。
中國9所機構,AI論文發表追趕MIT
2021年,發表論文總量世界前十名機構中,中國佔了9所,不同機構發表的論文總數如下圖,MIT位列第十,發表論文1745。
就電腦視覺領域(CV)來看,中國的十所機構位居世界前十,它們分別是,中國科學院、上海交通大學、中國科學院大學、清華大學、浙江大學、北京航空航天大學、武漢大學、北京理工大學、哈爾濱工業大學,以及天津大學。
在自然語言處理(NLP)領域,就有所不同了。
世界前十名的機構/公司有:中國科學院、卡內基美隆大學、微軟、清華大學、卡內基美隆大學-澳洲分校、Google、北京大學、中國科學院大學、阿里、亞馬遜。
語音辨識領域排名如下:
產業界領先學術界
在2022年發表的重要人工智慧機器學習系統中,語言系統佔最多,有23個,是多模態系統數量的6倍。
在論文產量上,產業界領先學術界。
直到2014年,大多數重要的模型都是由學術界發布的。從那時起,工業界便逆襲翻身。到2022年,32個重要的機器學習模型都誕生在工業界,而學術界只有3個。
由此可見,與非營利組織和學術界相比,建構最先進的人工智慧系統越來越需要大量的數據、電腦能力和資金資源,而產業參與者固然有更多的資金資源去做這件事情。
2022年,美國產生了數量最多的重要機器學習系統,有16個,其次是英國(8個)和中國(3個)。
此外,自2002年以來,就創建的重要機器學習系統總數而言,美國已經超過了英國和歐盟、中國
再來看做出這些重要AI系統背後研究者國分佈,美國有最多的研究者,285人,是英國的2倍多,是中國的近6倍。
LLM越來越大,算力越貴
大型語言和多模態模型,有時稱為基礎模型,是當前一種新興且日益流行的AI模型類型,它在大量數據上進行訓練並適用於各種下游應用。
ChatGPT、DALL-E 2和MakeA-Video等大型語言和多模態模型已經展示了令人印象深刻的功能,並開始在現實世界中廣泛部署。
透過對這些模型作者的國家隸屬關係進行了分析,這些研究人員中的大多數來自美國機構(54.2%)。
史丹佛AI指數報告也列出了大型語言和多模態模型發布的時間表。
大型語言模型正變得越來越大,也越來越昂貴。
第一個大型語言模型GPT-2於2019年發布,有15億參數,訓練成本約50,000美元。谷歌PaLM是2022年推出的大型語言模型之一,有5,400億參數,成本高達800萬美元。
從參數和訓練成本來看,PalM比GPT-2大360倍,成本高出160倍。
不僅僅是 PalM,從整體來看,大型語言和多模態模型變得越來越大和昂貴。
例如,DeepMind於2022年5月推出的大型語言模型Chinchilla估計耗資210萬美元,而BLOOM的訓練大約耗資230 萬美元。
隨著時間的推移,GAN在人臉生成方面的進展,最後一個圖像由Diffusion-GAN生成,這一模型在STL -10上取得了最新的SOTA。
去年,隨著OpenAI的DALL-E 2、Stability AI的Stable Diffusion、Midjourney、Meta的Make-AScene,以及Google的Imagen等模型的發布,文字到圖像生成模型逐漸走進大眾視野。
如下,輸入相同的提示,「一隻熊貓在溫暖的巴黎夜晚彈鋼琴」,分別由DALL-E 2、Stable Diffusion和Midjourney這三個可公開訪問的AI 文字到圖像系統產生的圖像。
在最近發布的所有文字到圖像生成模型中,Google的Imagen在COCO基準測試中表現最佳。
今年,創建Imagen的Google研究人員也發布了一個更難的文字到圖像基準測試 DrawBench,旨在挑戰功能越來越強大的文本到圖像模型。
此外,報告也介紹了當前生成式AI模型存在一些偏見,例如給DELLE-2提示CEO時,每個人似乎都採取了交叉雙臂自信的姿勢。
在Midjourney中,當提示產生「有影響力的人」時,它會產生4張看起來年長的白人男性圖像。
完整報告內容請參閱:
https ://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf
以上是史丹佛2023 AI指數報告出爐!中國霸榜AI頂會,中科院論文發表量世界第一的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在
