如果認為 ChatGPT 所代表的潮流是 AIGC 的一部分,將是對這個浪潮的巨大誤解。
ChatGPT 作為一款產品,展示了一個大語言模型(LLM)可能的應用場景,其中 AI 生成文本(AI Generated Text)的能力,尤其令人印象深刻。因為這一擠強心針,大家把對這個能力的熱情,泛化到了 AI 生成圖像,視頻,音樂等各種內容,並且籠統的起了個大詞兒的名字,叫做 AIGC。這裡面不僅包含了 ChatGPT 這樣的產品,也包括了 MidJourney 這樣優秀的圖像生成,以及 Stable Diffusion系列工具。至於視頻,音樂等反而沒有這麼流行,但也都被包了進來。
依照一般邏輯,如果AIGC 的範疇比ChatGPT 更大,那麼AIGC 是不是ChatGPT 所代表的那些大家說不清道不明的能力的超集呢?
我的答案是否定的。
ChatGPT 這一種LLM,不是打開了AIGC 的大門,而是打開了自然語言使用者介面(LUI , Language User Interface)的大門。 LUI 是一個比 AIGC 大不知道幾個數量級的世界。和 LUI 的大海相比,AIGC 就是一個小池塘。
人類和機器的接口,是相對穩定的,幾十年才變一次的東西。而每次變化帶來的改變都是深遠的。就拿近代我們和電器的介面為例來看一下:
#最早是 ##BUI(Button User Interface)。不用查了,這個字是我杜撰的,就是用按鈕,旋鈕,開關等做接口。但這個介面表達能力太弱了,根本無法表達循環,分支等。
然後就進入了 TUI(Text User Interface),就是命令列輸入指令,電腦執行。 Unix,DOS就是這一代。
後面是 GUI (Graphic User Interface)。這項誕生於施樂公司,應用於蘋果的 Macintosh,發揚於微軟的 Windows 的方式,一下子統治了從 80 年代到現在的從電腦到手機到平板的所有用戶界面。
而其中瀏覽器作為 GIUI (Graphic Internet User Interface),更是為網路插上了翅膀,直接就引爆了一個時代。
而大語言模型出來了,人們終於可以不用 GUI 了,而直接是用自然語言和機器互動了。那麼以前大家為什麼喜歡用 GUI ,而不直接用語言呢?因為技術達不到呀。前段語音辨識的準確率才剛過關,至於理解語意,甚至可以完美的回答,還遠遠達不到這個能力。
現在 ChatGPT 以及百花爭鳴的大模型出現了,這將在我們和電腦已經很方便的圖形介面的基礎上,進一步降低使用門檻。在已經很簡單的事情上再進一步簡單一點可以幫助的人群,遠大於一個複雜的東西降低很大的門檻(波音737的操作難度降低三個數量級大多數人還是不會開)。這一改變,會和人類社會的每一件事情,每一次人機互動有關,會改變所有的行業,所有的人的生活。 #
對比 AIGC,雖然也有很多令人興奮的進展,但是在這個技術發展史中,這是一個局部的進展。應用的也僅僅在內容生產這個領域,是局部的領域。它的發展,還需要更長的時間摸索。大語言模型的路徑是否可以應用圖像,視頻,聲音等領域還未知,下一個重大的突破在哪裡還不明朗。所以,我認為 AIGC 概念大於實質,和 LLM 以及 LUI 不可同日而語。
#以上是ChatGPT 帶來的 LUI 比 AIGC 大得多的詳細內容。更多資訊請關注PHP中文網其他相關文章!