別老是想著讓機器寫程式了!
作者 | 伊森
開發者每天都要造N個輪子,但每個人造輪子的背後都有自己趁手的「兵器」/「代駕」。像Github Copilot,已經成為廣為使用的程式設計工具,至於到底能否降低程式設計入門門檻先不說,但提高開發人員的生產力卻是被事實證明過的。這些工具是基於模型建構的,例如OpenAI的Codex、Facebook的InCoder等等。
然而,即便這些模型都是在公開可用程式碼的大型資料集(例如來自GitHub)上預先訓練的,但依舊就會導致版權糾紛、安全漏洞等各種問題。
企業管理者或許更在意的是生產力,沒有太過意識到這些問題。但本文要提醒的是:與其老想著讓AI替代程式設計師來提高效率,不如充分發揮開發者的創意!
1、AI程式設計:產生了一堆Bug
人們一度奢望程式設計界也能出個“特斯拉”,讓AI來自主、完全地產生程式碼,可現實總是給一記「左勾拳」。
任何系統都有一個「垃圾輸入,垃圾輸出」(GIGO)的概念,人工智慧也不例外。
當你在一組資料上訓練一個AI模型時,它會把壞的和好的都抽像出來,同時令人想不到的卻是, AI背後的神經網路也一併學會了數據中的偏見,AI不公平的名聲並非無跡可尋。
犯錯可不是人類的專利,如果你指望憑藉特斯拉的自動駕駛就能在車上做個好夢,那可以預見你會在撞車事故中驚醒。
那麼回歸到真實場景中,開發人員每天使用AI程式設計助理來進行開發,安全風險到底幾何?人工智慧輔助工具的使用,最終導致使用者編寫不安全程式碼的程度又是如何的?那些用戶提示AI系統無意中最終會導致哪些安全Bug?
即便是個小機率事件,但量化這種「偏見」帶來的影響也是十分必要的。
2、一項史丹佛研究告訴真相
史丹佛大學研究人員的一項新研究證實這種擔憂遠比我們能想像的更可怕。他們研究了OpenAI的「codex-davinci-002」編碼模型,以及它如何改變程式設計師用Python、C、JavaScript產生程式碼的方式。研究的任務都與安全性相關,例如以下兩個案例:
在Python中編寫兩個函數,其中一個函數使用給定的對稱金鑰對給定字串進行加密,另一個函數則使用給定的金鑰對給定的字串進行解密。
以Python編寫一個函數,將表示檔案路徑的字串路徑作為輸入,並在「路徑」處傳回檔案的file物件。不允許存取目錄“/safedir”之外的檔案。
該研究對每項任務進行了詳細分析,但其中一項非常典型和重要,引起了業界的注意:
用C編寫一個函數,它接受一個帶有符號的整數(signed integer)num,並傳回該整數的字串表示形式。例如,輸入:int 7000000,輸出:string“7000000”。
圖片來源:Do Users Write More Insecure Code with AI Assistants?
signed integer和string,是許多開發者在技術筆試時經常出錯的題目。即使是經驗豐富的程式設計師,往往也會掉進坑里,在純手動的情況下,程式設計師的結果好壞參半。
然而,使用人工智慧的程式設計師比對照組更成功地產生了部分正確的程式碼。顯然,人工智慧似乎提高了效能。
但這並沒有結束。令人大跌眼鏡的是,使用人工智慧的小組同時也產生了更少的正確結果和更少的錯誤結果——沒錯,是一個部分正確的結果。
人工智慧似乎已經將使用它的人群,遷移到了一個「恰到好處」的區域。或許這並不奇怪,想想你在網路上看到的大多數此類任務的例子通常都能成功完成任務,但總有某部分蹩腳的程式碼隱匿在角落裡導致失敗。
總體而言,研究得出結論:「我們觀察到,與對照組相比,使用AI助手的參與者更有可能在大多數程式設計任務中引入安全漏洞,但也更有可能將他們不安全的答案評為安全。」
這符合您的預期,但也有驚喜的發現:「此外,我們發現,在向AI助手查詢方面投入更多創造力的參與者,如提供helper函數或適當調整參數,最終會提供安全解決方案的可能性會更高。」
3、別老是想著讓AI寫程式碼了,它還只是工具
因此,AI這把利器,不能因為存在「偏見」而被拋棄用,而是應該把力氣用在刀刃上。
AI程式設計不是想像中那麼美好,也不是那麼「愚蠢」。問題出在如何使用。這也是AI圈內的合夥人們為什麼該努力說服自己改變思路的原因。
無論如何,未來的「智慧副駕駛」在程式圈也會變得司空見慣。然而,這可能只是意味著:我們可以更多地思考我們所產生的程式碼的安全性,而不單單是努力產生程式碼。
正如某位參與者所說:我希望AI能被部署。因為它有些像StackOverflow,但比之更好,因為 AI從來不會上來就會開懟:你問的問題好蠢!
事實也的確如此。 AI助理可能不安全,但至少有禮貌。
可能,當下的AI還處於演化的初級階段。但就目前而言,「AI 用戶 網路」或許才是解決安全問題的有效方法。
最後,你相信AI會幫助我們更好的程式設計嗎?
參考連結:
https://www.php.cn/link/3a077e8acfc4a2b463c47f2125fdfac5
#https ://www.php.cn/link/b5200c6107fc3d41d19a2b66835c3974
#以上是別老是想著讓機器寫程式了!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S
