OpenAI開源了:Transformer自動Debug工具上線GitHub
最近常被吐槽不夠開源的 OpenAI,突然開放了一次。
今天一早,OpenAI 機器學習研究員 Jan Leike 宣布,OpenAI 開放了自己內部一直用於分析 Transformer 內部結構的工具。
GitHub 連結:https://github.com/openai/transformer-debugger
該計畫開放才幾個小時,雖然沒有經過太多宣傳,star 數量上漲得也挺快。
Transformer Debugger 介紹
Transformer Debugger (TDB) 是由OpenAI 的對齊團隊(Superalignment)開發的一款工具,旨在幫助使用者檢查小型語言模型的特定行為。據了解,該工具結合了自動可解釋性技術和稀疏自動編碼器的特性。
具體來說,TDB 能夠在需要編寫程式碼之前進行快速探索,並能夠幹預前向傳遞,幫助人們查看它是如何影響模型特定行為的。 TDB 可用來回答諸如「為什麼模型在此提示(prompt)中輸出token A 而不是token B?」之類的問題或「為什麼注意力頭H 會在這個提示下關注token T?」
#其方法包括識別對行為有貢獻的特定組件(如神經元、注意力頭、自動編碼器隱變量),透過展示自動生成的解釋來分析導致這些組件最強烈激活的原因,以及追蹤元件之間的連接,從而幫助人們發現聯繫,進而協助進行Transformer的調試工作。
OpenAI 放出了幾段影片概述了TDB 的能力,並展示瞭如何使用它來進行論文《Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small 》中的工作:
本次,OpenAI 的開源內容包括:
- Neuron viewer:一個React 應用程序,用於託管TDB 以及包含有關各個模型組件(MLP 神經元、注意力頭和兩者的自動編碼器latents)資訊的頁面。
- Activation server:對主題模型進行推理,為 TDB 提供資料的後端伺服器。它還從公共 Azure 儲存桶讀取和提供資料。
- Models:GPT-2 模型及其自動編碼器的簡單推理庫,帶有捕獲激活的 hook。
- 整理好的激活資料集:包含 MLP 神經元、注意力頭和自動編碼器 latents 的頂級激活資料集範例。
安裝設定
請依照下列步驟安裝儲存庫。請注意,在此之前你需要 python/pip 以及 node/npm。
雖然不是必要,但OpenAI 建議使用虛擬環境進行操作:
# If you're already in a venv, deactivate it.deactivate# Create a new venv.python -m venv ~/.virtualenvs/transformer-debugger# Activate the new venv.source ~/.virtualenvs/transformer-debugger/bin/activate
#設定好環境後,請請按照以下步驟操作:
git clone git@github.com:openai/transformer-debugger.gitcd transformer-debugger# Install neuron_explainerpip install -e .# Set up the pre-commit hooks.pre-commit install# Install neuron_viewer.cd neuron_viewernpm installcd ..
要執行TDB 應用程序,你需要按照說明設定啟動伺服器後端和神經元檢視器前端。
要驗證更改,你需要:
- #運行pytest;
- 運行mypy —cnotallow=mypy.ini;
- 運行啟動伺服器和神經元檢視器,並確認TDB 和神經元檢視器頁面等基本功能仍然有效。
Jan Leike 表示,TDB 目前仍然是一個早期階段的研究工具,OpenAI 希望透過開源的方式讓更多人受益,並期待社群在其基礎上不斷改進。
以上是OpenAI開源了:Transformer自動Debug工具上線GitHub的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

檢查CentOS系統中HDFS配置的完整指南本文將指導您如何有效地檢查CentOS系統上HDFS的配置和運行狀態。以下步驟將幫助您全面了解HDFS的設置和運行情況。驗證Hadoop環境變量:首先,確認Hadoop環境變量已正確設置。在終端執行以下命令,驗證Hadoop是否已正確安裝並配置:hadoopversion檢查HDFS配置文件:HDFS的核心配置文件位於/etc/hadoop/conf/目錄下,其中core-site.xml和hdfs-site.xml至關重要。使用

CentOS系統下GitLab的備份與恢復策略為了保障數據安全和可恢復性,CentOS上的GitLab提供了多種備份方法。本文將詳細介紹幾種常見的備份方法、配置參數以及恢復流程,幫助您建立完善的GitLab備份與恢復策略。一、手動備份利用gitlab-rakegitlab:backup:create命令即可執行手動備份。此命令會備份GitLab倉庫、數據庫、用戶、用戶組、密鑰和權限等關鍵信息。默認備份文件存儲於/var/opt/gitlab/backups目錄,您可通過修改/etc/gitlab

在CentOS系統上啟用PyTorchGPU加速,需要安裝CUDA、cuDNN以及PyTorch的GPU版本。以下步驟將引導您完成這一過程:CUDA和cuDNN安裝確定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA顯卡支持的CUDA版本。例如,您的MX450顯卡可能支持CUDA11.1或更高版本。下載並安裝CUDAToolkit:訪問NVIDIACUDAToolkit官網,根據您顯卡支持的最高CUDA版本下載並安裝相應的版本。安裝cuDNN庫:前

Docker利用Linux內核特性,提供高效、隔離的應用運行環境。其工作原理如下:1. 鏡像作為只讀模板,包含運行應用所需的一切;2. 聯合文件系統(UnionFS)層疊多個文件系統,只存儲差異部分,節省空間並加快速度;3. 守護進程管理鏡像和容器,客戶端用於交互;4. Namespaces和cgroups實現容器隔離和資源限制;5. 多種網絡模式支持容器互聯。理解這些核心概念,才能更好地利用Docker。

在 CentOS 上安裝 MySQL 涉及以下步驟:添加合適的 MySQL yum 源。執行 yum install mysql-server 命令以安裝 MySQL 服務器。使用 mysql_secure_installation 命令進行安全設置,例如設置 root 用戶密碼。根據需要自定義 MySQL 配置文件。調整 MySQL 參數和優化數據庫以提升性能。

CentOS系統下查看GitLab日誌的完整指南本文將指導您如何查看CentOS系統中GitLab的各種日誌,包括主要日誌、異常日誌以及其他相關日誌。請注意,日誌文件路徑可能因GitLab版本和安裝方式而異,若以下路徑不存在,請檢查GitLab安裝目錄及配置文件。一、查看GitLab主要日誌使用以下命令查看GitLabRails應用程序的主要日誌文件:命令:sudocat/var/log/gitlab/gitlab-rails/production.log此命令會顯示produc

在CentOS系統上進行PyTorch分佈式訓練,需要按照以下步驟操作:PyTorch安裝:前提是CentOS系統已安裝Python和pip。根據您的CUDA版本,從PyTorch官網獲取合適的安裝命令。對於僅需CPU的訓練,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,請確保已安裝對應版本的CUDA和cuDNN,並使用相應的PyTorch版本進行安裝。分佈式環境配置:分佈式訓練通常需要多台機器或單機多GPU。所
