最近隨著ChatGPT爆火出圈,網路上各種關於ChatGPT的爭論聲也不斷;有些人把它當成一個更高級的聊天機器人,有人興奮地看到了創業的風口,而另一些人對它取代人類的工作露出了不少擔憂;那麼它到底是推動社會不斷前進的工具,還是妄圖顛覆人類社會的T-1000?本文我們來深入的探討ChatGPT的那些事。
當我們在談論ChatGPT時,討論的是聊天的欣喜,是失業的擔憂,是未來的憧憬。
ChatGPT看似好像在一夜之間突然火起來,但其實它並不是一個什麼新鮮的概念,最早的人工智慧可以追溯到1950年,艾倫·圖靈(Alan Turing)發表了里程碑式的論文《電腦器與智慧》,又稱《機器能思考嗎? 》,在這篇論文裡,第一次提出了很有哲學的概念:模仿遊戲,也正是我們所熟知的大名鼎鼎的圖靈測試,正是這篇文章為圖靈贏得了人工智慧之父的桂冠。
圖靈測試就是將測試人和被測試者(一台機器或人),在沒有面對面的情況下,讓測試者通過一些測試裝置(例如鍵盤)像被提問者發問,如果被測試者超過30%的答复,不能使測試人確認出哪個是人、哪個是機器的回答,那麼這台機器就通過了測試;這樣的機器也被稱為圖靈機,圖靈機也只是一個設想,並不是真正的機器。
圖靈測試
其實我們發現圖靈測試並沒有對人工智慧進行直接的定義,什麼樣才算是人工智慧;而是反其道而行之,並沒有拘泥於繁雜的過程,以結果為導向,達到什麼樣的結果(欺騙到測試人),才算是人工智慧;我們有時在處理棘手問題時也可以換個思路,以結果為起點對問題進行拆解。
在傳記電影《模仿遊戲》中,也對這位孤獨的天才提出的設想進行了描繪,當圖靈被警探關到審訊室時,警探提出了一個意味深長的問題:機器能思考嗎?圖靈提出了玩一個遊戲(正是圖靈測試);最終圖靈露出了笑容,他感覺到警探理解了遊戲規則。
在圖靈測試被提出後,許多科學家和實驗室也向這個測試發起了衝擊;在1966年,MIT實驗室誕生了一個真正意義上的聊天機器人Eliza,它的定位是一名心理治療師。
Eliza
Eliza主要的策略就是提出問題,重新表達使用者所說的話,引導使用者多描述問題。例如你告訴它:我今天有點頭痛(headache),它就會告訴你頭痛就去諮詢醫生用藥;如果你說今天有點很沮喪(depressed),然後它就會說聽說你不開心,表示很難過;如果你又說我媽媽(mother)照顧我,它會問你家裡還有誰來照顧你。
Eliza透過關鍵字配對規則對輸入進行分解,而後根據分解規則所對應的重組規則來產生回應;通俗點說就是抓取句子中的關鍵字,例如發現句子中有媽媽這個關鍵詞,她就會說:跟我說說你的家庭;其實它的背後就是很多的if/else程式碼。
到了1995年,受到Eliza的啟發,理查德·華勒斯開發了一個聊天機器人Alice,並於1998年開源;Alice的技術原理主要是基於自然語言處理,它的目的是模仿人類的自然語言,與使用者進行有意義的對話。它可以回答關於天氣、新聞、體育等各種話題的問題,也可以與用戶進行有趣的聊天。
Alice
不過目前階段,無論是Eliza或Alice,他們的原理都是基於模式匹配(Pattern Matching) ,透過提取關鍵字,呼叫預先設好的文字來回應。
這些對話機器人雖然能夠進行簡單的語言交互,但是對語句缺乏深度的理解和推理能力,很難和人類的對話水平相比。
但這種模式也不是一無是處,可以避免很多重複性的工作,反而在我們身邊也很常見。例如常見的購物網站、銀行網站或App等,進入聊天介面先給你一個熱情的聊天機器人,巴拉巴拉羅列一堆關鍵字諮詢你想幹嘛。
上面我們也說到了,模式匹配的方式就算if/else代碼寫的再多,但是機器還是不能理解句子的真正含義,只是簡單的回复,因此出現了一個新的模式,也就是:機器學習。
顧名思義,就是不進行人為的規定問題和答案,而是給機器一堆現成的案例,讓機器來進行學習,這種方式也更符合人類學習的認知規律。
這個階段比較出名的就是SmarterChild(更聰明的小孩),它是ActiveBuddy股份有限公司於2001年開發,該聊天機器人用在了老牌即時通訊AIM,能夠進行有趣的對話并快速訪問其他服務的數據,如天氣、股票和電影數據;你甚至可以責罵它、刁難它,它似乎總是知道如何來應對。
SmarterChild也是最早整合到即時通訊平台的聊天機器人之一,在當時迅速引起了轟動,有3000多萬用戶在使用它;後來於2006年被微軟收購,也被應用到了MSN Messenger上。
SmarterChild
#不過SmarterChild後,聊天機器人被遺棄了好幾年,微軟也關閉了SmarterChild的高科技部門。
2010年隨著機器學習中的一個領域人工神經網路(Artificial Neural Networks簡稱ANNs)的爆發,人工智慧迎來了空前的發展。
它的靈感來自生物學,國中生物課本中我們學到過,動物的神經網路能夠處理大量複雜的信息,就是透過大約1000億個神經元彼此連接來執行功能;人工神經網路要做的就是模擬大腦中的基本單元:神經元。
人工神經網路看起來很厲害,其實本質上就是一個不斷的提取特徵的過程,跟我們小時候學會認知事物很相似,就是找不同事物的特徵;人工神經網路在得到一串樣本資料後,也是透過學習擷取所觀察事物各部分的特徵,將特徵之間進行關聯,再經過反覆的訓練,最後輸出得到正確的答案。
透過這個過程,我們也能發現,人工神經網路需要大量的資料訓練和強大的運算能力支撐;隨著網路的快速發展,大量的資料集也不再是問題。
Siri成立於2007年,2010年由蘋果以2億美金收購,最初也是以文字聊天為主,隨後與全球最大的語音識別廠商Nuance合作,Siri實現了語音識別的功能,並於2011年在iPhone 4S上首次亮相,在當時引發轟動,iPhone 4S也成為了一代神機。
Siri識別你的聲音使用的就是深度卷積網絡,也是人工神經網絡的一種;iPhone中專門有一個低功耗的處理器來運行這個神經網絡,當相似度達到一定的閾值,就會啟動Siri。
❝
Siri的推出也標誌著聊天機器人技術進入了一個新的時代,
❞
Siri在官網宣傳
時間來到了2017年,Google在《Attention is all you need》一文中發布了一個新的機器學習模型:Transformer模型,此模型主要用於克服機器翻譯中傳統網路訓練時間過長,難以較好實現平行運算的問題。
傳統的自然語言處理(例如語音辨識、語言建模、機器翻譯)依賴循環神經網路(Recurrent Neural Network, RNN),利用循環進行順序操作,也就是一個字一個字的學習,有著訓練時間過長、難以並行計算的缺點。
而Transformer模型拋棄了傳統的時序結構,並行處理序列中的所有單字或符號,同時利用自註意力機制將上下文與較遠的單字結合;這就相當於學渣還在一個字一個字看書時,學霸已經一目十行,幾個段落都看完了,這學習效率自然就槓槓的。
微軟的GPT模型和Google的BERT模型,其中的T都是代表Transformer模型的意思。
我們發現一個規律,科學技術的發展進步總是伴隨著理論研究的提出與突破。
既然模型有了,那肯定就有公司來對其進行商業化了,我們先來說說ChatGPT的母公司OpenAI,它於2015年由一群矽谷科技大佬成立,包括我們熟知的特斯拉創辦人埃隆·馬斯克等,成立之初就確認了公司的主要目標:
包括製造「通用」機器人和使用自然語言的聊天機器人。
2018年,OpenAI在Transformer的模型基礎上,又發布了生成式預訓練語言模型(Generative Pre-trained Transformer,即GPT-1);不過老對手谷歌的BERT很快就出現了,並且性能上全面碾壓了GTP。
ChatGPT的發展歷程
那被對手超過了OpenAI自然就不甘心了,於是瘋狂砸錢,增大了訓練資料集,陸續又發布了GPT-2和GPT-3模型,模型的參數量也從GPT-1的1.25億個迅速「狂飆」到GPT-3的1750億個;數量更龐大的參數量也意味著模型具有更強大的表達能力和更小的預測誤差,也就是可以產生更長、更自然的文字。
海量的模型參數就讓GPT-3在一些比較複雜的問題上也能有很好的表現,例如代替人類寫一些論文,甚至寫SQL語句、JavaScript程式碼等等。
2021年,OpenAI基於GPT-3模型進行修改和改進,調整了模型參數,添加了訓練數據,年末發布了GPT-3.5,也就是目前很火的ChatGPT的原始模型。
2022年11月,ChatGPT上線僅幾天就獲得了100萬用戶,上線兩個月,其月活就達到了驚人的1億,成為歷史上用戶增長最快的消費應用。
月活1億每個App需要月數
大量用戶湧入的背後,是需要龐大的算力成本和伺服器的投入;根據某研究機構的測算,運行這麼複雜的GPT-3.5模型,需要的GPU晶片的數量就高達2萬枚,而專業級顯示卡一般使用A100;根據某購物網站的數據,10萬人民幣一塊A100顯示卡的價格在國內還是有市無價;因此粗略計算下,單單顯示卡的投入就至少在20億以上;還有其他如數據採集、人工標註、模型訓練等軟性成本更是難以統計。
聊了這麼多的ChatGPT的發展歷程,相信大家對這上百億投入的「高級聊天機器人」肯定也都迫不及待、躍躍欲試了,那麼這裡筆者就分享一下註冊的攻略;由於眾所周知的某些原因,國內用戶並不能流暢的直接訪問,註冊的過程也會有一些曲折,因此我們需要做好以下準備工作:
首先我們準備好一個接收簡訊驗證碼的手機號,打開sms-activate.org並註冊帳號,語言調整為中文,點擊右上角充值按鈕,付款方式選擇支付寶。
充值
帳號最低儲值金額是1美元,依照目前匯率折算下來也就大概七塊多人民幣;我們可以先儲值1美元。在左邊選擇國家,然後搜尋OpenAI,租期預設4小時,點選出租;這裡不同國家的價格也不相同,一般東南亞國家如印尼、泰國、印尼價格會便宜,但現在用的人比較多,有機率會被OpenAI屏蔽或沒有號碼的情況;其他歐美國家相對貴些,1美元有可能下不來,例如筆者選擇的西班牙,就砸下去整整2美元。
❝
可以對不同的國家號碼進行嘗試,在四小時內沒有收到簡訊是可以退款的。
❞
租用號碼
手機號碼準備完成後,我們就可以來註冊了,打開signup頁面,在輸入郵箱地址、密碼以及驗證郵箱後,我們就來到了驗證手機號碼的頁面,我們選擇上面租用手機號碼的相應國家,然後貼上號碼、點擊發送即可。
貼上手機號碼時需要把前面的國際區號刪掉。
驗證手機號碼
回到sms-activate頁面,我們在留言中可以看到收到的OpenAI的code ,黏貼即可。
收到驗證碼
註冊完成後我們開啟chat.openai.com/chat就可以使用了。
主介面
它的使用方式也很簡單,在下面輸入框中輸入你的問題,點擊發送按鈕,就能喜提一個上知天文下知地理、無所不能的話癆機器人了。
所以,這麼多科技大佬砸了幾百億研發出來的ChatGPT,只是用來給我們聊天的嗎?要了解這個問題,我們不妨先來問問ChatGPT自己吧。
應用程式場景
確實,讓ChatGPT當作聊天機器人,確實有點殺雞用牛刀了;但是,我們先來看看這把牛刀,用來殺雞到底夠不夠快呢?我們要是想要搞點事情,就需要呼叫API,而OpenAI剛好在近期提供了API Keys的接入方式,可以將ChatGPT整合到我們的應用程式和服務中。造訪platform.openai.com,點選API Keys => Create按鈕,在出現的彈框複製keys即可。
❝
彈框隱藏後就看不到api key了,需要去重新生成。
❞
產生API keys
複製成功後,這裡推薦wechatbot這個項目為個人微信接入ChatGPT;有多種方式來運行項目,可以基於源碼運行,也可以基於docker來運行,不過都需要用到上面複製出來的key,具體運行方式可查看項目說明,這裡不再展開了;如果對docker不了解的小伙伴可以查看這篇文章。
專案運行後,使用微信掃碼登入即可,然後我們的微訊號就自動接入了ChatGPT的聊天了;使用方式也十分的簡單,私聊這個微訊號會直接回复,群裡需要@這個微訊號。
❝
重要提示:濫用有可能會被微信封禁危險,盡量用小號,本文不承擔任何責任。
❞
微信聊天機器人
不過要注意的是,每個帳號的API的呼叫也是有限制的,目前是5美元,還有過期時間,大家娛樂玩就好,有條件的朋友可以充值。
除了用來聊天,在工作和學習中,也深受眾多學生和職場人追捧。在國外一所大學哲學教授評分時,十分驚喜的讀到了一篇“全班最好的論文”,論文以簡潔的段落、恰當的舉例和嚴謹的論據探討了一個哲學問題;然而在教授的追問下,學生「承認了論文是用ChatGPT寫的」。
在工作上,ChatGPT也挽救了不少職場人的髮際線,用它生成了包括且不限於:領導演講稿、媒體通稿、集團簡介、頒獎詞、祝酒詞、宣傳冊等等,甚至連週報月報、請假理由這些微不足道的小事,它也能給你包圓咯。
請假理由
在文字潤飾方面,ChatGPT絲毫不輸專業的編輯,在周報月報甚至是年報中,這就相當實用了,懂得都懂。
週報
對於一些簡單的工具函數,我們可以很方便的讓ChatGPT直接產生即可;例如我需要一個隱藏手機號碼的函數,描述這個函數的功能即可;甚至還能夠聯繫上下文,這是以往的人工智慧沒有實現的。
產生javascript函數
#ChatGPT不僅幫助我們解決了問題,還能有理有據的解釋問題背後的邏輯;例如筆者上週在Vue3中使用KeepAlive組件就遇到了問題,在搜尋百度後,雖然有很多的回答,但我們還需要在大量的網頁中去進行二次篩選,最後可能篩選出來的解決方式都是千篇一律(互相抄襲);而且用下來也是錯誤百出,各種報錯,用戶體驗十分不友好,估計花了大半天的時間才解決問題。
錯誤的案例
例如百度找到的這篇文章中,如果使用紅色線框中的寫法,vue- router就會出現各種奇怪的報錯,而且出現的錯誤訊息根本沒辦法去搜尋。
但是筆者如果使用ChatGPT提問,我們看到它邏輯清晰,還有具體的案例和注意的提示,我們只需要把組件的名稱放到include屬性下即可;在它的幫助下,筆者相信在當時能夠跳脫錯誤的邏輯,大大縮短解決問題的時間。
ChatGPT的回答
#在文案生成方面,ChatGPT也是一把好手;當我們面對空白的文檔苦苦思索的時候,不妨打開ChatGPT,描述我們的需求,輕鬆的生成一段粗略的文案,在此基礎上進行再次編輯,節省時間和壓力。
在先前辦公室軟體一文中我們就介紹了ONLYOFFICE,在ONLYOFFICE官網免費下載桌面版或免費註冊線上個人版,在辦公室軟體裡面使用ChatGPT,快速的生成文案。
首先需要安裝插件,我們在github克隆程式碼後,找到/sdkjs-plugins/content/openai/,選擇所有檔案加入ZIP文件,然後把文件格式改成plugin;開啟文件介面,找到插件=> Setting => Add plugin,選擇我們的plugin文件,插件就成功安裝了。
新增外掛
然後輸入上面取得到的API Key,我們的外掛程式就啟動完成了;在文字欄位中描述我們想要產生的文案內容,點擊提交按鈕即可;ChatGPT會對請求進行處理,在幾秒鐘內回傳回應,並在文件中以純文字的形式插入。
生成文案
許多小夥伴看到這裡肯定也不得驚嘆:這ChatGPT確實太厲害了!筆者的許多程式設計師小夥伴也都在感嘆:我們是不是要失業了,但是目前看來暫時還不會,畢竟它的訓練成本確實高昂,應用落地起來不容易。
取代打工人
但有一些崗位,像是客服崗位,就比較容易受到衝擊了;相信大家應該都接到過類型的機器人客服電話,都是識別特定的關鍵字,按照固定流程,一句話一句話的回复;隨著ChatGPT的出現,相信未來機器人客服能夠應對更加複雜的場景,更加精準的理解顧客的需求,從而靈活的因應。
❝
ChatGPT會完全取代程式設計師的工作嗎?
❞
在程式設計方面,筆者覺得ChatGPT在目前階段還不能完全的取代程式設計師;在產生程式碼片段雖然能夠很好的實現,有點類似之前的Copilot;但是在複雜的專案中,需要去理解不同文件模組的含義,從而進行調用,ChatGPT就無法取代了;在代碼bug修復、前後端聯調、跨部門協調、出差對接等需要組織協調的工作上更是無法替代人工。
筆者認為ChatGPT帶來更多的是程式設計效率的提升;例如原來我們需要一天做的工作量,有了它的協助,一些重複簡單的模組我們直接丟給他就能生成了,最終可能不到半天就能夠完成了。
❝
商湯科技董事長:未來軟體的程式碼可能80%都是由AI產生的。
❞
雖然目前看來並不能完全的替代,隨著硬體成本不斷降低、機器學習能力提高;當機器訓練的成本低於程式設計師的薪水時,你覺得資本家在需要繳交五險一金、時不時還要摸魚的你和三、四毛一度電、24小時不停運轉的機器之間如何抉擇呢?相信未來原本可能需要數十人的研發部門,最終只需要三、四個核心工程師維修就能確保業務的正常進行。
❝
未來我們如何去選擇就業?
#❞
未來ChatGPT雖然會取代一部分低端的職位,但肯定也會不斷創造出新的職位;就像電腦的出現淘汰了打字員,但是創造了大量的程式設計師崗位一樣,人工智慧創造出很多新興崗位,比如提示詞顧問師(筆者自己臆想),專業負責提問ChatGPT產生對應文案或素材;這是社會進步的必然趨勢,也是逼著被歷史大勢裹挾前行的我們,不斷的學習進步。
取代程式設計師
在前端方面肯定也會淘汰很多初級的程式設計師,程式設計師的門檻不斷降低;因此我們需要在人工智慧取代之前不斷的學習進步;筆者認為在WebGL方面,人工智慧對於複雜圖形化和對美學的理解還是不能夠取代人工,因此前端的小夥伴可以嘗試進階這塊領域,同時高階架構師也是不錯的方向。
相信在不久的未來,ChatGPT能夠幫助我們極大的提升生產力和學習效率;面對新技術或新文章時,不需要再完整的閱讀,讓ChatGPT產生文章的大綱和主要內容,幫助我們快速學習;在寫文件時,也能夠讓它快速產生一篇文字優美的內容。
我們正處於一個見證歷史的時刻,沒人能夠在人工智慧的歷史洪流面前獨善其身,保持傲慢不屑的態度只會加速被淘汰,正如小說《三體》中所說的那樣:
##在電影流浪地球2中,劉培強問Moss,人類能活下來嗎? Moss說人類的命運取決於自己的選擇;就像我們現在問ChatGPT會不會取代程式設計師一樣,雖然它告訴我們還無法完全取代,但是如何做出選擇,是關係著我們每個人的命運;而當歷史的車輪緩緩駛過時,我們唯一要做的事,就是盡量跑在它的前面。❝
弱小和無知不是生存的障礙,傲慢才是。
❞
以上是ChatGPT的狂飆之路的詳細內容。更多資訊請關注PHP中文網其他相關文章!