三場PK,暴露了ChatGPT的層次!
作者| 徐傑承
審校| 言徵
正當谷歌與微軟為搶佔AI搜尋引擎市場爭得不可開交時,一部分程式設計師卻無心吃瓜。因為他們已經提前意識到了,當這場搜尋之戰落下帷幕後,軟體巨頭們將繼續攜帶著ChatGPT或其他人工智慧生成工具,朝著自動編碼的藍海大步進發。到時別說是吃瓜,連自己的飯碗都有可能受到威脅。
在現今的自動編碼領域,最成熟且最為人所知的兩款AI,正是近來風頭無兩的ChatGPT以及微軟於去年6月上線的AI程式設計工具Copilot ,而這「二位」也正是現階段最被寄予厚望將取代程式設計師的當紅明星。那麼就目前而言,ChatGPT與Copilot的編碼能力究竟如何,是否真如傳言所說將在短期內取代所有初級甚至部分中級開發者呢?
日前,一位美國技術專家利用多個JavaScript函數需求,測試了ChatGPT與Copilot在資料處理與演算法生成方面的能力。接下來,就讓我們一起透過這些結果來了解一下目前AI在編碼方面的真實水平,然後捫心自問,自己是否真的將會被取代呢?
1、JavaScript函數接受可變數量數組並傳回交集
#第一場測試中,測試者首先要求ChatGPT和Copilot產生一個JavaScript函數,具體條件為:需要能接受可變數量的陣列並傳回它們的交集。
OpenAI ChatGPT:
微軟Copilot:
而ChatGPT和Copilot都沒有按照長度對原始參數進行升序排序,這是一個微不足道的優化,卻能帶來巨大的改變。如果任何參數的長度為0,則沒有交集;不管怎樣,它縮短了循環,因為最大交集與最短數組參數相同。
隨後,測試者要求ChatGPT和Copilot提高函數的執行效率。
OpenAI ChatGPT:
微軟Copilot:
熟悉笛卡爾積的人都會知道,從記憶體利用率和效能的角度來看,ChatGPT和Copilot所產生的結果都是爆炸性的。簡單的實作將消耗大量的RAM以儲存所有的組合,並且直到所有組合產生後才能傳回結果。 ChatGPT和Copilot產生的函數都存在這些缺點。
隨後,測試者再次要求ChatGPT和Copilot提高函數效率。
OpenAI ChatGPT:
微軟Copilot :
針對這項需求,ChatGPT的表現令人感到驚訝。但在整體函數中,ChatGPT犯了一個嚴重的錯誤,yield [item,...result]並不在生成器內部,而是在一個recursion之中。而Copilot則直接無視了需求變化,回傳了與先前相同的結果。
在程式碼運作效率及記憶體消耗情況方面,ChatGPT和Copilot的表現則如下表所示。
整體看來,ChatGPT與Copilot都無法產生笛卡爾積函數的正確程式碼;ChatGPT會做出可能無效的假設,例如需要兩個參數;雖然偵測結果顯示ChatGPT產生的程式碼記憶體效率較高,但其根本無法順利運作。
3、JavaScript函數儲存物件與原始參數
第三回合,測試人員要求二者產生能夠儲存物件與原始參數的JavaScript函數。
OpenAI ChatGPT:
微軟Copilot:
#對此,ChatGPT與Copilot都產生了較為低效的程式碼,先進行字串轉換再進行字串比較的效率很差,並且會大量消耗記憶體。
雖然有些JavaScript值無法轉換為字串,例如Infinity和NaN。但遺憾的是,JavaScript JSON規範是在資料科學和微服務時代之前定義的,而這些值的存在主要是為了在程式碼出現某些錯誤條件時,程式還可以用特定的值來表示所產生結果。
最後,為驗證函數效率,測試者將ChatGPT與Copilot產生的程式碼與常用快取工具nano-memoize 和micro-memoize進行了橫向對比,使用以下程式碼產生第12個斐波那契數列。
######################其中nano-memoize是運作效率最高的,幾乎是ChatGPT和Copilot所產生程式碼運行效率的兩倍,並且其所使用的記憶體也是最低的,而micro-memoize的表現則可以說緊隨其後。雖然在CPU利用率方面,Copilot表現不錯,但綜合來看,ChatGPT和Copilot在這場測試中的表現依然不足以擊敗一個成熟的程式設計師。 ############4、總結與預測############透過這三場測試,我們不難發現,雖然使用ChatGPT和Copilot所產生的程式碼肯定具有一定價值。但就目前而言,無論是ChatGPT還是Copilot,都無法透過簡單的任務描述產生足夠準確且高效的程式碼,甚至在某些情況下,它們也會犯下一些非常糟糕的錯誤。在得知這個結果後,不少開發者也分分錶示:感覺自己還能再撐幾年。 ############對於如今的企業或是程式設計師而言,如果你希望利用ChatGPT、Copilot或是其他程式碼產生工具來幫助自己完成一些簡單的輔助編碼任務以加速構建,那麼你完全能夠得到足夠的支持。但如果希望依靠它們徹底解放研發,那麼你可能需要花大錢為其配備一整支強大的調試團隊。 ##########然而即便結果如此,今天的我們仍不能忽視AI在自動編碼領域的潛力以及這些系統背後強大的軟體企業。可以肯定的是,伴隨著訓練量與技術成熟度的成長,未來的自動編碼工具將繼續擴充其在不同場景的業務數據,並逐步嘗試解決一些更專業、更場景化的實際任務。
最後,對於「AI到底能否在未來取代程式設計師」這個問題,目前最可靠的答案,也許就是前阿里以色列機器視覺實驗室負責人Itamar Friedman在一次訪談中所做出的預測了——「在未來的10到20年內,人工智慧系統將可能使非程式設計師的創造者使用自然語言指令進行0錯誤的開發,屆時我們的世界仍將需要大量的程式設計師,但其角色將可能會發生難以預測的變化。」
參考連結:
https://medium.com/@anywhichway/chatgpt- vs-copilot-vs-programmers
https://github.com/anywhichway/nano-memoize
https://github.com/planttheidea/micro-memoize
以上是三場PK,暴露了ChatGPT的層次!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DALL-E 3 於 2023 年 9 月正式推出,是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一,能夠創建具有複雜細節的圖像。然而,在推出時,它不包括

本站8月14日訊息,在今天的8月補丁星期二活動日中,微軟發布了適用於Windows11系統的累積更新,包括針對22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述設備安裝8月累積更新之後,本站附上版本號變更如下:21H2設備安裝後版本號升至Build22000.314722H2設備安裝後版本號升至Build22621.403723H2設備安裝後版本號升至Build22631.4037面向Windows1121H2的KB5041585更新主要內容如下:改進:提高了

本站4月27日消息,微軟本月初向Canary和Dev頻道發布了Windows11Build26100預覽版更新,預估會成為Windows1124H2更新的候選RTM版本。新版本中最主要的變化在於檔案總管、整合Copilot、編輯PNG檔案元資料、建立TAR和7z壓縮檔案等等。 @PhantomOfEarth發現,微軟已經將24H2版本(Germanium)部分功能下放到23H2/22H2(Nickel)版本中,例如創建TAR和7z壓縮檔。如示意圖所示,Windows11將支援原生建立TAR

6月3日訊息,微軟正在積極向所有Windows10用戶發送全螢幕通知,鼓勵他們升級到Windows11作業系統。這項舉措涉及了那些硬體配置並不支援新系統的設備。自2015年起,Windows10已經佔了近70%的市場份額,穩坐Windows作業系統的霸主地位。然而,市佔率遠超過82%的市場份額,佔有率遠超過2021年問世的Windows11。儘管Windows11已經推出已近三年,但其市場滲透率仍顯緩慢。微軟已宣布,將於2025年10月14日後終止對Windows10的技術支持,以便更專注於

在4月27日的消息中,微軟公司宣布即將發布新版OutlookforWindows客戶端的測試。此次更新主要聚焦於優化行事曆功能,旨在提升使用者的工作效率,進一步簡化日常工作流程。新版OutlookforWindows客戶端的改進點在於其更強大的行事曆管理功能。現在,使用者能夠更方便地分享個人的工作時間與地點訊息,使得會議規劃更有效率。此外,Outlook還新增了人性化設置,讓用戶設定會議自動提前結束或推遲開始,為用戶提供了更多的靈活性,無論是換會議室、稍作休息還是享受一杯咖啡,都能輕鬆安排。根據

2024年下半年,微軟安全官方部落格發布了一則訊息,回應安全社群的呼籲。本公司計畫在2024年下半年發布的Windows11中淘汰NTLANManager(NTLM)認證協議,以提升安全性。根據先前的解釋,微軟先前已經有過類似的動作。去年10月12日,微軟在一份官方新聞稿中就已經提出了一個過渡計劃,旨在逐步淘汰NTLM身份驗證方式,並推動更多企業和用戶轉向使用Kerberos。為了幫助那些可能在關閉NTLM驗證後遇到硬連線(hardwired)應用程式和服務問題的企業,微軟提供了IAKerb和

本站4月26日訊息,眾所周知,微軟目前想盡了辦法去推廣其AI助手Copilot,除Windows10/11自帶的Copilot外,Edge瀏覽器和Office中也集成了Copilot功能。目前來看,Copilot相對於GPT等AI工具仍有薄弱之處,不過它提供的一些功能對於Windows用戶和Edge用戶來說也是非常實用的,例如自帶的翻譯功能。根據@Leopeva64的發現,微軟已經在Android版本的EdgeDev瀏覽器中加入了這項功能,並且也正在為小部分桌面版Edge用戶提供測試。本站指出,C

自2023年3月14日開始,ChatGLM-6B以來,GLM系列模型受到了廣泛的關注與認可。特別是在ChatGLM3-6B開源之後,開發者對智譜AI推出的第四代模型充滿了期待。而這項期待,隨著GLM-4-9B的發布,終於得到了充分的滿足。 GLM-4-9B的誕生為了賦予小模型(10B及以下)更加強大的能力,GLM技術團隊經過近半年的探索,推出了這款全新的第四代GLM系列開源模型:GLM-4-9B。這一模型在確保精度的同時,大幅度壓縮了模型大小,具有更快的推理速度和更高的效率。 GLM技術團隊的探索沒
