沒想到,在大模型時代,知名「AI 教母」李飛飛也要「創業」了,完成了種子輪融資。 根據路透社獨家報道,著名電腦科學家李飛飛正在創建一家新創公司。該公司利用類似人類的視覺數據處理方式,使人工智慧能夠進行高階推理。 知情人士透露稱,李飛飛最近為這家公司進行了種子輪融資,投資者包括矽谷創投公司Andreessen Horowitz,以及她去年加入的加拿大公司Radical Ventures。 不過,Andreessen Horowitz 和 Radical Ventures 的發言人都對此保持沉默,李飛飛也未作回應。 #李飛飛被譽為「人工智慧教母」,此頭銜源自「人工智慧教父」稱號,通常用來致敬三位在電腦科學領域取得卓越成就的拓荒者- 傑弗裡・辛頓(Geoffrey Hinton)、約書亞・本吉奧(Yoshua Bengio)和楊立昆(Yann LeCun)。他們因在 AI 技術方面的突破於 2018 年獲得電腦界的最高獎項圖靈獎。 李飛飛的成名作是開發了一個名為ImageNet 的大規模圖像資料集,該資料集幫助開創了第一代能夠可靠識別物體的電腦視覺技術。李飛飛也是史丹佛大學以人為中心人工智慧研究所(Human-Centered AI Institute)的共同主任。該所專注於以 “改善人類狀況” 的方式發展 AI 技術。除了學術工作外,李飛飛在 2017 年至 2018 年期間領導了谷歌雲端的 AI 部門,擔任 Twitter 董事會成員。 李飛飛曾對人工智慧研究方面存在的資金缺口表示遺憾。她指出,儘管私部門資源豐富,但學術界和政府實驗室的資金支持仍捉襟見肘。她呼籲美國政府拿出「登月思維」,投資這項技術的科學應用及其風險研究。 根據李飛飛的史丹佛履歷顯示,她從 2024 年初到 2025 年底處於「Partial Leave」狀態。她的研究興趣涵蓋了「認知啟發的 AI」、「電腦視覺」和「機器人學習」等領域。 在職業社交網站領英上,李飛飛將自己的當前工作狀態描述為「新手」和「新事物」,從 2024 年 1 月開始。 這次創業,李飛飛捲入了最熱門的AI 公司之間的競爭:教導演算法具備常識,以克服當前技術的局限性,如大語言模型可能產生的幻覺。許多人認為,這種「推理」能力必須先建立起來,然後人工智慧模型才能實現通用人工智慧(AGI),即係統能夠像人類一樣或更勝一籌地執行大多數任務。 一些研究人員認為,他們可以透過建立更大、更複雜的模型來提高推理能力,而其他人則認為,未來的道路涉及使用新的“世界模型」,這些模型可以吸收來自周圍物理環境的視覺訊息,以發展邏輯,複製嬰兒的學習方式。 在介紹這家新創公司時,一位消息人士引用了李飛飛上個月在溫哥華 TED 會議上的一次演講。她在演講中表示,該前沿的研究涉及一種可以合理地推斷出圖像和文字在三維環境中的樣子的演算法,並根據這些預測採取行動,這種演算法概念叫做「空間智能」。為了進一步解釋「空間智慧」這個概念,她展示了一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她表示,在一瞬間,人類大腦可以評估「這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關係」,然後預測會發生什麼,並採取行動加以阻止。 她說:「大自然創造了一個以空間智慧為動力的觀察和行動的良性循環。」她還補充說,她所在的史丹佛大學實驗室正在嘗試教導電腦「如何在三維世界中行動」,例如,使用大型語言模型讓一個機械手臂根據口頭指令執行開門、做三明治等任務。
這讓人聯想到2023年李飛飛公佈的研究VoxPoser以及VIMA 機器人智能體。
VoxPoser將大模型連接到機器人,可在無需額外資料和訓練的情況下,將複雜指令轉化為具體的行動。
而VIMA 智能體能像GPT-4 一樣接受多模態的(文字、影像、影片或它們的混合)Prompt 輸入,然後輸出動作,完成指定任務。
我們也可以進一步回顧李飛飛近期的一些其他相關研究。例如,今年1月份,李飛飛在X 上推廣了一篇有關3D 人體渲染工作的新進展—— 一種名為Wild2Avatar 的新模型,該模型即使在有遮擋的情況下仍然能夠完整、高保真地渲染人體。 在此之前,李飛飛領導的一個多學科聯合團隊也曾發表研究,提出了一種通用型的智慧BRI 系統NOIR( Neural Signal Operated Intelligent Robots / 神經訊號操控的智慧機器人),可以腦控機器人做家事,例如烹飪、熨衣服、玩遊戲等。
期待李飛飛的創業公司,能為 AI 社群帶來新的驚喜。 以上是史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」的詳細內容。更多資訊請關注PHP中文網其他相關文章!