CHEATC2023|中科大陳小平:從大模型到柔性機器人
今年以來,伴隨著ChatGPT的持續火爆,大模型也進入高速發展期,國內外多家知名科技企業相繼推出自主研發的大模型產品。那麼大模型的技術原理是什麼呢?
5月18日,受邀參加2023中國家用電器技術大會(CHEATC2023)的中國科學技術大學機器人實驗室主任陳小平教授分享了他的研究和觀點,他同時也擔任中國人工智慧學會人工智慧倫理與治理委員會主委,在本次大會上陳小平教授發表了「人工智慧的新發展:從大模型到柔性機器人」主題演講,介紹了人工智慧大模型的技術原理,以及人工智慧在應用層面的新技術趨勢。
中國科技大學教授陳小平
「大模型的根本原理就是在做預測」陳小平介紹道,人工智慧發展到現在已經開啟了第四次浪潮的進程,資料模型也由大數據驅動轉向大訓練驅動。和先前三波不同的是,新階段的人工智慧對訓練資料的質、量和取得方式都有了全新的要求,最終形成能夠應用於大規模真實場景的實例模型。他強調,大模型是由多種技術整合而成的智慧系統,而非單一或少數技術的簡單組合。 ”
大模型的興起來自生成式人工智慧,當前,生成式人工智慧已經並不僅是簡單的進行語言和圖像等內容的生成,而是基於對人的自然語言的精準處理來完成智慧化人機互動。陳小平表示:「目前階段,我們對於機器的語言處理預期是會說人話、能聽懂人話、能回答問題,即使回答不一定正確。其中,基本的要求是說話要符合人的語言習慣。 「由於人的語言習慣沒有科學標準但是有經驗標準,那麼機器如何掌握和利用人的語言習慣呢?陳小平表示:「大模型的基本研究思路和成功秘訣是:從人類大規模的語料中提取語言痕跡,並用於人機自然語言的互動之中。」
大模型透過從人類原始語料中提取包括字、詞、標點符號等語元,再根據前後語元的關聯性進行語元回看,最終實現行為的預測。原則上,回看的語元數量越多,預測的準確度就更高。至少有4000個語元能夠被大型模型回顧,某些模型能夠回顧高達10萬個語元。 」陳小平講到。大模型技術體係以預訓練模型為基礎大模型,再透過專門訓練的專用模型配合用戶引導模型來精準理解和回答用戶的問題。三大模型相互配合,人工智慧回答的品質可以實現大幅度提升。
儘管大型模型的出現為人工智慧帶來了新的創新路向,但它並不適用於現實場景的所有方面。據陳小平所述,當前中國亟待攻克的三大人工智慧領域是智慧製造、智慧農業和普惠養老。 「攻克這三大戰役,我們全球的格局將會發生徹底的改變。」另一方面,大模型帶來巨大變化的同時也帶來了新的挑戰。當大型模型是基於對人類功能進行模仿時,很可能會被認為具有情感和意識。這是因為人們習慣性地將自己對某個概念的理解套用到涉及該概念的整體結構中,認為該結構所表達的訊息也具備同樣的意義,但實際上並非如此。 」陳小平表示,大模型的應用還可能產生公共安全、就業和長期影響。
除了大型模型,陳小平教授還取得了關於「人工智慧在物理世界」的新的科研成果。目前,我們投入應用的人工智慧物理形態主要是剛性機器人,這種機器人的重複精度高,但靈巧性和安全性較低,適用於結構化的環境中,而在非結構化的環境中需要進行精準測量、建模和計算,技術要求較高,目前還不適用於大多數的產業。針對剛性機器人的這些缺點,陳小平提出了融差原理,在智慧機器人的操作對象的精準測量不可行、工作環境和操作對象的精準建模不可行、精準決策不可行這三個基本假設之下,研發了氣動蜂巢網路軟體手臂。這種手臂在靈活度和負荷能力方面均有良好的表現,並且在有外力干擾和物體進行不規則運動時,均能實現精準化控制。預計在家庭服務、情感互動、自動駕駛等領域,這種技術有廣泛的應用前景。另一方面,陳小平團隊也將柔性手臂和剛性機器進行了結合,帶來了「剛柔合一手爪」的實驗結果,在不改程式和硬體參數、不使用力回饋感測器的情況下,實現對多形態物品的精準抓握。
以上是CHEATC2023|中科大陳小平:從大模型到柔性機器人的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。近日,由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”,面向智慧交通领域,为西安及其周边地区打造智慧交通创新支点。“秦岭·秦川交通大模型”结合西安当地海量开放场景下的交通生态数据、中科视语自研的原创先进算法以及西安未来人工智能计算中心昇腾AI的强大算力,为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。交通管理在不同城市有不同的特点,不同道路的交

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型(LLM)所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖,並藉鑒了FastTransformer中高效的Kernels實作。此外,它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異,客製化算子以滿足特定需求,例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案,致力於提供高效能並不斷完善其實用性。 TensorRT-LL

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

如果試題太簡單,學霸和學渣都能考90分,拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard,引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何,也有了最新參考。與先前大家分數都相近的MTBench相比,Arena-Hard區分度從22.6%提升到87.4%,孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建,與人類偏好一致率也高達89.1%

6月13日消息,根據字節旗下「火山引擎」公眾號介紹,小米旗下人工智慧助理「小愛同學」與火山引擎達成合作,雙方基於豆包大模型實現更智慧的AI互動體驗。據悉,位元組跳動打造的豆包大模型,每日能夠高效處理數量多達1200億個的文本tokens、生成3000萬張內容。小米借助豆包大模型提升自身模型的學習與推理能力,打造出全新的“小愛同學”,不僅更加精準地把握用戶需求,還以更快的響應速度和更全面的內容服務。例如,當使用者詢問複雜的科學概念時,&ldq
