目錄
軟體工程=互動日誌
軟體工程中的多任務模型
給AI模型配個程式設計師
結論
首頁 科技週邊 人工智慧 谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

Jun 07, 2023 pm 05:25 PM
ai 開發

任何一個大型軟體都不是一開始就構思完善的,而是透過開發人員的一次次改進、編輯、單元測試、修復建置錯誤、解決程式碼審查,再循環解決問題,直到滿足上線需求後才能把程式碼合併到倉庫。

控制整個過程的學問就叫做軟體工程

軟體工程並非一個獨立的過程,而是由開發人員、程式碼審查員、錯誤報告員、軟體架構師和各種開發工具(如編譯器、單元測試、連接器、靜態分析器)之間的交流組成。

最近,Google公佈了自家的DIDACT(Dynamic Integrated Developer ACTivity,動態整合開發人員活動)框架,以AI技術增強軟體工程,將軟體開發的中間狀態作為訓練數據,輔助開發人員編寫、修改程式碼,並即時了解軟體開發的動態。

谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

DIDACT是一個多任務模型,在編輯、調試、修復和程式碼審查在內的開發活動上進行訓練

研究人員在內部建構並部署了三個DIDACT工具,註釋解析、建構修復和提示預測,每個工具都整合在開發工作流程的不同階段。

軟體工程=互動日誌

幾十年以來,Google的軟體工程工具鏈都是將與程式碼相關的每個操作都儲存為工具和開發人員之間的互動日誌。

原則上,使用者可以使用這些記錄來詳細重播軟體開發過程中的關鍵變更過程,即Google的程式碼庫是如何形成的,包括每一次的程式碼編輯、編譯、註解、變數重命名等。

Google的開發團隊會將程式碼存放在monorepo(單一倉庫,mono repository)中,也就是包含所有工具和系統的程式碼儲存庫。

軟體開發人員通常在雲端中客戶端(Clients in the Cloud, CitC)系統管理的本機寫入時複製(copy-on-write)工作空間中對程式碼修改進行實驗。

當開發者準備好將一組程式碼變更打包在一起實現某個任務時(例如修復某個bug),需要在Google的程式碼審查系統Critique中創建了一個變更清單(changelist, CL)。

與常用的程式碼審查系統一樣,開發人員與同儕審查者會就功能和風格進行交流,然後編輯CL以解決評審註解時提出的問題。

最終,審查員宣布程式碼「LGTM!」後合併CL到程式碼庫。

當然,除了與程式碼評審員的對話之外,開發人員還需要維護大量與其他軟體工程工具的「對話」,包括編譯器、測試框架、連結器、靜態分析器、模糊測試工具等。

谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

軟體開發中涉及的複雜活動網路的說明:開發人員的活動、與程式碼評審員的互動以及對編譯器等工具的調用。

軟體工程中的多任務模型

DIDACT利用工程師和工具之間的互動對機器學習模型賦能,透過建議或最佳化開發人員在執行軟體工程任務時的行動,來輔助Google開發人員參與軟體工程過程。

為此,研究人員定義了一些關於單一開發人員活動的任務:修復損壞的建置、預測程式碼審查註解、處理程式碼審查註解、重新命名變數、編輯檔案等。

然後為每個活動定義一個通用的形式:取得某個State(程式碼檔案)、某個Intent(特定於某個活動的註釋,例如程式碼審查註釋或編譯器錯誤),並產生一個Action(用來處理任務的動作)。

其中Action就像一個迷你程式語言,可以擴展為新加入的活動,涵蓋了編輯、新增註解、重新命名變數、標記程式碼錯誤等內容,也可以稱這種語言為DevScript。

DIDACT模型的輸入提示為任務、程式碼片段和與該任務相關的註釋,輸出為開發動作,如編輯或評論

狀態-意圖-行動(State-Intent-Action)的定義形式能夠以通用的方式捕捉不同的任務,更重要的是,DevScript可以簡潔地表達複雜動作,不需要像動作發生後那樣輸出整個狀態(原始程式碼),使得模型更有效且更可解釋。

例如重新命名可能會修改程式碼檔案中的多處地方,但模型只需要預測一個重新命名操作。

給AI模型配個程式設計師

DIDACT在個人輔助任務上運作得非常好,例如下面的例子中示範了DIDACT在功能完成後的程式碼清理工作,先輸入代碼審查員的最終註釋(圖片中標記為human),然後預測解決註釋中提出問題所需的操作(用diff展現)。

谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

給定程式碼的初始片段和程式碼審查員附加到程式碼片段的註釋,DIDACT的Pre-Submit Cleanup任務會產生處理這些註解的編輯操作(文字的插入和刪除)

DIDACT的多模態性質也產生了一些隨規模增大而湧現出的全新行為,其中一種能力是歷史增強( history augmentation),可以經由提示來啟用這種能力,了解開發人員最近做了什麼可以讓模型更好地預測開發人員下一步應該做什麼。


谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

#歷史增強程式碼補全的示範

#歷史增強程式碼補全任務可以展現這種能力,在上圖的範例中,開發人員加入了一個新的函數參數(1),並將遊標移到文件中(2)。根據開發人員的編輯歷史和遊標位置,模型能夠準確預測新參數的文檔字串條目並完成第三步驟。

在難度較大的歷史增強編輯預測任務中,模型能夠以歷史一致的方式選擇下一步編輯的位置。

谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高

在多個鍊式迭代上的編輯預測的示範

如果開發人員刪除了函數參數(1),則模型可以根據歷史正確地預測對刪除參數的文檔字串(2)的更新(而無需人類開發人員手動地將遊標放置在那裡),並且在語法上(也可以說是語意上)正確地更新函數(3)中的語句。

有了歷史後,模型可以明確地決定如何正確地繼續「編輯程式碼過程」,而如果沒有歷史記錄,模型就無法知道遺失的函數參數是故意的(因為開發人員正在進行更長的編輯操作以刪除參數)還是意外情況(模型應該重新添加參數以修復問題)。

除此之外,模型還可以完成更多的任務,例如從空白檔案開始,要求模型連續預測接下來的編輯操作,直到寫出一個完整的程式碼文件。

最重要的是,該模型能夠以對開發人員來說很自然的、循序漸進的方式輔助編寫程式碼:

首先創建了一個具有導入、標誌和基本main函數的完整工作框架;然後再逐步添加新功能,例如從文件中閱讀和寫入結果,並添加基於用戶提供的正則表達式來過濾某些行的功能。

結論

DIDACT將Google的軟體開發過程轉變為機器學習開發人員助理的訓練演示,並使用這些演示資料來訓練模型,以循序漸進的方式建立程式碼,與工具和程式碼審查人員互動。

DIDACT方法補充了Google和其他公司的大型語言模型所取得的巨大成就,可以減少工作量,提高生產力,並提高軟體工程師的工作品質。

以上是谷歌公開自家「AI+軟體工程」框架DIDACT:數千名開發者內部測試,用了都說生產力高的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1323
25
PHP教程
1272
29
C# 教程
1251
24
C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

See all articles