「未來,我認為最具革命性的AI2.0應用是AI-First。」創新工場董事長李開復在演講中說道。
什麼是AI-First應用?就是指那些離開大模型就無法存在的應用。
5月28日,創新工場董事長兼執行長、創新工場人工智慧工程院院長李開復在2023中關村論壇上,發表了題為《AI1.0到AI2.0的新機遇》的演講。
他在演講中針對那些對大模型發展存疑的聲音,從大模型發展的商業價值、AI2.0對未來應用生態的影響以及中國大模型發展的展望等方面,給出了自己的見解。
他表示,即便是不完美的大模型,也存在著數十兆美元的商業價值。未來的AI2.0市場預計將是行動互聯網規模的10倍,容納得下巨頭、中小企業、新創公司在三個層級的賽馬。期待能形成巨頭、中小微型創新企業一起發展的「創新綜合體」。
以下是李開復演講全文(有刪減)
很高興有這個機會從我們投資機構的角度來看最近的AI2.0,我可能是投資機構裡最懂AI的,也可能是AI領域裡最懂投資的。我感到非常興奮,因為在過去兩年中,AI2.0和大規模模型的出現讓我幾乎閱讀了過去五年的所有相關論文。創新工場的投資、科技團隊也都在研究這個領域,為此也特地到美國去了解OpenAI、Google和微軟的一些最新動態。
今天我想介紹的不是創新工場投資的公司或其他實際的業務,而是針對近期很多關於AI2.0大模型方面的質疑,希望能夠做一個比較通俗的講解,對大家有所幫助。
01
大模型的商業價值
什麼叫AI2.0?在我們創新工場看來,從投資產生經濟價值的角度,將AI的發展階段分成AI1.0和2.0。深度學習在AlphaGo之後得到了AI1.0的發展,隨後被廣泛應用於各個行業並創造了價值。
自 1989 年起,就開始了 AI1.0 的發展。然而,近幾年遇到了一些難題,而這些難題正好可以透過大型模型來解決。 AI1.0遇到的瓶頸是什麼?當時還沒有大模型的時候,我們要做一個領域的AI應用,需要去該領域收集、清洗、標註數據,然後再拿去調整模型,整個過程的成本是非常昂貴的。
對於像是抖音、阿里或百度這樣的大公司來說,那是沒有問題的,他們收集的數據實在太多了,可以用來賺錢的機會也很多,但是如果你是一家銀行、保險公司或工廠,那麼在AI應用的落地方面就存在著巨大的問題,成本高得難以承受。
大模型的優點在於可以進行一次全面的訓練,然後透過遷移學習或微調來應用。 AI1.0時代每個應用都是一個孤島,但有了大模型之後,一次性用海量的資料去訓練一個基礎大模型,再用這個模型去調適所需的應用,這樣成本就降低了很多。例如類似「小愛同學」這樣的音箱產品,可能會碰到一旦跳出「小愛同學」懂的領域,它就蒙了,你會發現智能音箱其實並沒那麼智能,它只能做一些放音樂、查天氣的簡單事情,還有很多事情都做不了。但當你放了一個類似ChatGPT的東西進去,它的知識儲備就被啟動了,只要你把它的對話模式調整好,就能成為一個非常好的對話機器人。
一個非常完美的大規模模型即使在商業上也有相當大的價值,甚至可以達到數萬億的規模。這就看人類如何與它合作,也就是所謂的Human in the loop。
記者用AI來幫他寫作,或是律師用AI來幫他做訴訟,最後只要這個文章或訴訟還是由人來把關和負責,AI只是做一個初步的撰寫,那就沒有問題。考慮到人們已經了解到人工智慧也可能會犯錯,因此我們只允許它起初提供草稿稿件,而非直接為用戶服務,以保障用戶不會受到錯誤訊息的傷害。
AI充分發揮其大量資料基礎的優勢,例如可以在看了1000篇文章的基礎上寫出新的總結,看完過去一萬個歷史訴訟的基礎上寫出總結,這些高質量的總結可以讓記者或律師得到有用的信息,讓人來把關AI有沒有犯錯。
還有就是在某些領域裡,大家其實不在乎AI犯錯,比如在娛樂的應用裡,做個遊戲裡面的英雄,鬍子長一點短一點,都是無傷大雅的,或者它講錯了一句話也沒什麼關係,反正在遊戲裡都是杜撰的。其實很多應用領域是可以容忍這些不完美的大模型的,基於這個事實的分析,AI在生產力方面的應用有著巨大潛力。當然有些領域非常關鍵,是不能容忍犯錯的,例如新聞搜尋、政府的網站或是醫療教育相關,這些領域就很難做,未來需要解決大模型犯錯這個問題。
02
#AI2.0改寫應用生態
我們完全可以想像今天的Word、PowerPoint、Excel、Photoshop等應用程式通通都會用AI大模型重寫一次,而且重寫之後它的使用者體驗會變,甚至商業模式也會改變。還有一些領域,他可能犯錯的代價不是太大,例如用來做廣告的推播,一個廣告推錯了,也是無傷大雅的。今天我們本來就被錯誤地推送了很多廣告,我們打開電視和網站所接收到的廣告也不是有針對性的,但是AI可以讓廣告變得更有針對性,雖然偶爾它也會犯錯。
所以只是上面這幾個領域,我覺得就是一個幾十萬億美元的機會了。當然我們還要繼續努力,降低它胡說八道的頻率,這裡有一整套的方法,從預訓練的數據到訓練的對齊,再到之後的處理,還有一些預警和臨時能夠快速修正的方法,這些結合在一起,我相信是可以做到的。
生產力是最大的機會。 AI2.0大概有三個生態,我們平常談到最底層的是基礎模型,剛才上面談到的是最上層的應用層,例如幫你們寫稿子、寫訴訟、畫圖、摳圖等。還有一個中間層,提供各種工具來優化模型並實現遷移學習,以幫助大模型更有效率地應用。中間層有兩個部分,第一種是從基礎模型層往外擴展,比如說模型做得這麼大,需要做推理的時候能不能把它縮小,針對某一個領域把一個大模型變成一個小模型,或者剛才講的去降低胡說八道頻率的問題。
另外一種是從應用層往下的調整,像是我們要重寫一個photoshop的時候,你可以講一句話圖就出來了,但是可能還要再進一步說我要把彩虹顏色變一變,或者裡面的觀眾男女比例調一下,這就需要大模型有一個智能的切割,對一些物體有理解才能做到。這些其實跟大模型本身沒有直接的關係,但你沒有這些功能,就不可能把photoshop推送給想做圖的人。
中間層其實非常重要,中間層讓我們想到什麼?比如說windows、安卓、蘋果提供的中間層目的非常簡單──讓應用程式開發的成本降到最低。這樣才能讓應用程式的數量變多,打造一個使用者帶來更多應用程式的良性循環。
在先前的演講中,我提到了AI2.0時代的到來-一種平台加應用的模式。一旦掌握了這種平台技術,它將會改變各個領域。我們可以明顯地感覺到,比如說在製造遊戲的時候,你所有角色的產生,包括背景、道具、衣服甚至所有的代碼,最終都會用AI來寫,所以很可能以後一些小朋友在社區裡面把他想玩的遊戲寫出來,大家彼此用文字做一個遊戲的介紹,幾秒鐘以後就可以玩了。
剛才講的電商和廣告也是一個例子,我們可以針對每一個人,根據他的需求、認知、教育程度以及購物習慣,為其量身定做廣告和圖片,這樣會最大程度地提高他的購買慾望。當然這裡會面臨監管的問題,如果你寫的是假的,或是傷害了用戶怎麼辦?這還是需要法律的監督,但希望這兩個例子大家可以理解,大模型真的不只是一個問答引擎,它改變了所有APP的生態,它會讓我們今天用的每一個生態系統都被改寫一次。
03
#要做大模型時代的AI-First
大模型改革的不只是人工智慧,還會帶來一些平台式的巨大差距。所有的應用裡面,AI-First將是最重要的應用,什麼是AI-First?就是這個應用沒有AI,它就不成立。例如我們現在用的一些Mobile-First應用,像美團、滴滴、抖音這類公司,它們開發的應用是基於行動手機全天候在人身上的前提下,離開手機,這些應用就沒辦法用。
這些公司是充分完整地利用了行動手機帶來的功能,開發出了適應行動手機的新應用,獲取了我們的地理位置,我們才能用它們完成打車、外賣這些活動。那麼其他公司,像是新浪、網易、豆瓣等,他們在行動網路時代也做得挺好,但它們只是把PC的應用平移了過來,所以並沒有得到同樣的爆發。當年如果要選擇在行動網路創業或投資,那一定要選那些非有行動不可的APP,那麼今天要在人工智慧領域創業,就一定要做非有人工智慧不可的APP。
簡單來說,AI-First意味著如果沒有大型模型,該應用程式將變得完全無用。這種應用是我們今天特別需要做,它將是這個時代未來的寵兒,它的整個用戶體驗可能更多地是用人類的語言來學著跟我們交流,而不是逼著我們去學計算機的語言。
當然我們都知道還有很多的挑戰,這裡包括假資訊、隱私保護等問題。強調監管的加強是必要的,同時我們也需要更多的技術來解決這些問題。如果僅僅用監管或技術肯定是不夠的,兩種方式應該結合起來做。
最近市場上出現了一些有爭議的聲音,例如「使用海外的開源大模型就可以做出中國版OpenAI」「不需要做大模型,小模型就足夠了」「大模型燒錢且耗人,只有巨頭才有入場券”“中國大模型創業公司過多”等。在我看來,開源是非常重要的,中國的科技未來肯定需要開源,因為高校還有創業者沒有開源,很難得到啟動的力量。
但我們千萬不要相信一些網路上說的我拿了一個開源模型,比如說GPT-4去訓練,突然發現模型跟GPT-4一樣好了,所以大模型沒有價值了,你們都不用做了,這個是絕對錯誤的。
因為第一,開源模型本身可能有局限性,當你做大模型訓練的時候,需要非常多的GPU,成本比較大。開源模型基本上是把你這個模型的天花板定下來了,然後你再做裡面的對齊調整和學習的工作,這些工作帶給模型的提升是由你的天花板決定的。如果從一開始你的目標就是GPT-4這樣的天花板,那麼就不可能製作出一個比它更大的模型。第二,很多人用GPT-4來訓練它們的開源模型,但我們真的不能保證GPT-4未來會繼續開放使用。微調從海外訓練出的模型在國內使用是很危險的。因為國內外的文化、習慣、法規都不一樣,拿一套美國訓練出來的模型來中國調試,你覺得那些框架能解決國內的問題嗎?
所以我還是相信大模型開源是有必要的,當然未來不可能有50家大模型公司存在,這個會收縮到一個比較小的數字,就像美國搜尋引擎剛開始的時候也有10家,後面透過併購,剩下來的五、六家都發展得很好。像Google是最後起來的,反而發展成第一,所以我覺得其實具體會有幾家,是以大公司為主還是小公司為主,現在都還沒辦法太早下定論,大家都還有機會。
今天尤其在這個領域我們還在趕的時候,還是應該鼓勵各種不同的發展模式,因為我們也很難知道誰能做成。
大模型演進有三步,第一步是中等規模的大模型,大多數中國參與者都在這一步,第二步是跨越「湧現」門檻,成為主流大模型,目前中國部分大模型公司已經達到600億的數據規模,大致處於第二個階段了,但是中國的數據質量還不夠高,想要邁入第三階段,數據質量和數據規模都很重要;第三步是成為領先的大模型公司。目前只有國外的兩家公司到了第三步,他們的模型資料規模和資料品質都很不錯,還有一個人類回饋的強化學習,它能連結到許多下游的應用。
我想講的一點是在模型方面,特別我覺得OpenAI的GPT-4裡面有一點大家都沒注意到,就是它的模型擴展(scale up)功能,這個功能號稱可以用千分之一或萬分之一的時間來預測一個模型的訓練是否會成功。
當我們訓練一次大模型要一個月的時候,如果犯錯了,那就浪費了幾千個GPU,那麼這套scale up的功能一定程度上量化了訓練成功的可能性,可以減少浪費。不過我們現在並不知道OpenAI如何操作這個scale up的,只能從他們發出的一些論文裡去試著做這個事情。即使我們缺乏GPU,仍然有必要了解如何最大化利用我們的GPU。
模型大小並非大模型發展的唯一決定因素,資料品質更重要。在AI1.0時代,我們訓練各種不同的語言模型的時候,數據是越多越好,有一點小錯也無傷大雅,但是大模型訓練我們得到的經驗是數據質量跟數量都重要,但是相比來說品質是不可犧牲的,這一塊我認為需要國家的力量來幫助和推動。
美國的網路數據比中國的品質還要高,比如說我們家人健康上有任何的問題,我一定是去WebMD或Cleveland Clinic上去找,但中國就沒有類似的網站。中國目前還沒有公益性的數據匯集平台,所以我們還是需要國家政府的力量去推動高品質數據的匯集,縮小與國外數據品質的差異,接下來中美的差距可能就體現在這個數據品質上面。
04
#AI2.0展望
我相信,未來最具革命性的AI2.0應用將是AI-First。最終能夠脫穎而出的是那些敢於全力投入新科技的先驅者。以前,人類需要學習電腦語言,但未來可能是電腦學習我們的語言,這將大大節省我們的時間。我們只要把想做的事告訴AI它就會幫我們完成。例如我可以跟智能助理說,明天是我太太的生日,我需要鮮花、蛋糕、禮物,它就統統幫我搞定,這個就節省我巨大的時間。我們目前正在招募助手來幫助我們完成這些任務,以節省時間。未來,這些任務都可以由AI助理完成。
未來,我也相信大模型不會只是一個聊天工具,會慢慢超越使用者的期望,發展成一個智慧生產力工具。最終這一天到達的時候,我們會發現目前的商業模式將會改變,App Store就不存在了。
例如當我跟AI說我老婆生日幫我買蛋糕、鮮花時,它就不用去電商網站了,可以直接跟倉庫下單,所以會顛覆現有的商業模式,帶來更多的經濟機會。現在我們看到的AI應用基本上都是在虛擬世界,但是未來AI將走向實體。我們有一個理念叫Embodied AI,就是說你將大量的影片當作訓練數據,也有可能讓機器人了解你的需求。你跟它說來點薯片,它就知道需要打開抽屜,需要拿盤子,需要倒出來等等,當然未來三五年之內可能很難見到它們進入實際應用的場景,但學術和產業的結合讓這一切看起來並不是遙不可及的。
所以AI大模型是中國不能錯過的歷史機遇,這是有史以來最大的一個平台革命,它比windows、安卓帶來的變革要大10倍。它會改寫所有的應用,重建人類的工作,讓有創意的人能更好地聚焦於研究工作,將他們的聰明才智放大10倍或更多,同時很多重複性勞動會被取代。
儘管中國起步比美國晚了一些,但由於龐大的應用市場以及我國經濟各方面的強大連結性,我們仍然有很大的發展潛力。中國政府在資源分配和工作安排方面的表現優於西方國家,能夠成功將更多中國人引導到適合他們的職位。中國還有巨大的人才優勢,中國的AI工程師、AI科學家數量都非常多,可能頂尖的還是在美國,但中國很多年輕的科學家也都非常厲害。不過我們還有一個挑戰,就是過去的算力不如美國,在大模型上的經驗會比較少,但是我相信在政府、大企業和投資公司的共同努力之下,我們一定很快能夠克服這樣的問題。
美國著名的投資機構的安德里森·霍羅維茲對這個領域有一個預測:「這個市場的潛在規模難以把握——將介於所有軟體和所有人類的努力之間。」AI2. 0市場預計將是行動互聯網規模的10倍,期待能形成巨頭、中小微型創新企業一起發展的「創新綜合體」。
來源:中國企業家雜誌
以上是李開復:AI大模型是不能錯過的歷史機會的詳細內容。更多資訊請關注PHP中文網其他相關文章!