一篇學會本地知識庫對LLM的效能優化-安全-PHP中文網

首頁

運維

安全

一篇學會本地知識庫對LLM的效能優化

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 12, 2023 am 09:23 AM

最佳化效能知識庫

昨天一個跑了220個小時的微調訓練完成了，主要任務是想在CHATGLM-6B上微調出一個能夠較為精確的診斷資料庫錯誤訊息的對話模型來。

一篇學會本地知識庫對LLM的效能優化

#不過這個等了將近十天的訓練最後的結果令人失望，比起我之前做的一個樣本覆蓋更小的訓練來，差的還是挺大的。

一篇學會本地知識庫對LLM的效能優化

#這樣的結果還是有點令人失望的，這個模型基本上是沒有實用價值的。看樣子需要重新調整參數與訓練集，再做一次訓練。大語言模型的訓練是一場軍備競賽，沒有好的裝備是玩不起來的。看來我們也必須升級一下實驗室的裝備了，否則沒有幾個十天可以浪費。

從最近幾次的失敗的微調訓練來看，微調訓練這條路也不容易完成。不同的任務目標混雜在一起跑訓練，可能不同的任務目標所需的訓練參數不同，使最終的訓練集無法滿足某些任務的需求。因此PTUNING只適合某個十分確定的任務，不一定適合混合任務，以混合任務為目的的模型，可能需要用FINETUNE。這和前幾天我在和朋友交流時大家的觀點類似。

其實因為訓練模型難度比較大，有些人已經放棄了自己訓練模型，而採用將本地知識庫向量化後進行較為精準的檢索，然後透過AUTOPROMPT將檢索後的結果產生自動提示，去問打語音模型。利用langchain很容易達成這個目標。

一篇學會本地知識庫對LLM的效能優化

#這個工作的原理是將本機文件透過載入器載入為文本，然後對文字進行切分行程文字片段，經過編碼後寫入向量儲存中功查詢使用。查詢結果出來後，透過Prompt Template自動形成提問用的提示，去詢問LLM，LLM產生最後的回答。

這項工作裡有另一個要點，一個是較為精準的搜尋到本地知識庫中的知識，這個透過向量儲存於搜尋來實現，目前針對中英文的本地知識庫的向量化與搜尋的解決方案很多，可以選擇某個對你的知識庫比較友善的方案來使用。

一篇學會本地知識庫對LLM的效能優化

#上面有一個在vicuna-13b上通過關於OB的知識庫進行的問答，上面的是沒有使用本地知識庫，直接使用LLM的能力的回答，下面是加載了本地知識庫後的回答。可以看出性能提升還挺明顯的。

一篇學會本地知識庫對LLM的效能優化

我們再來看看剛才那個ORA錯誤的問題，在沒有使用本地知識庫之前，LLM基本上是胡說八道的，而載入了本地知識庫之後，這個回答還是中規中矩的，文中的錯字也是我們知識庫中的錯誤。實際上PTUNING所使用的訓練集也是透過這個本地知識庫產生出來的。

從最近我們踩過的坑可以收穫一些經驗。首先ptuning的難度比我們想像得高很多，雖然說ptuning比finetune需要的裝備低一點，不過訓練難度一點都不低。其次是透過Langchain和autoprompt利用本地知識庫來改善LLM能力效果不錯，對於大多數企業應用來說，只要把本地知識庫梳理好，選擇合適的向量化方案，應該都能獲得不比PTUNING/FINETUNE差的效果。第三，還是上回說的問題，LLM的能力至關重要。必須選擇一個能力較強的LLM作為基礎模型來使用。任何嵌入式模型都只能局部改善能力，不能扮演決定性的角色。第四，對於資料庫相關的知識，vicuna-13b的能力確實不錯。

今天一大早還要去客戶那邊做個交流，早上時間有限，就簡單寫幾句吧。大家對此有何心得，歡迎留言討論（討論僅你我可見），我也是在這條路上孤獨行走，希望有同路人指點一二。

以上是一篇學會本地知識庫對LLM的效能優化的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7561

CakePHP 教程

1384

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

不同Java框架的效能對比 Jun 05, 2024 pm 07:14 PM

不同Java框架的效能比較：RESTAPI請求處理：Vert.x最佳，請求速率達SpringBoot2倍，Dropwizard3倍。資料庫查詢：SpringBoot的HibernateORM優於Vert.x及Dropwizard的ORM。快取操作：Vert.x的Hazelcast客戶端優於SpringBoot及Dropwizard的快取機制。合適框架：根據應用需求選擇，Vert.x適用於高效能Web服務，SpringBoot適用於資料密集型應用，Dropwizard適用於微服務架構。

PHP 陣列鍵值翻轉：不同方法的效能比較分析 May 03, 2024 pm 09:03 PM

PHP數組鍵值翻轉方法效能比較顯示：array_flip()函數在大型數組（超過100萬個元素）下比for迴圈效能更優，耗時更短。手動翻轉鍵值的for迴圈方法耗時相對較長。

C++ 程式最佳化：時間複雜度降低技巧 Jun 01, 2024 am 11:19 AM

時間複雜度衡量演算法執行時間與輸入規模的關係。降低C++程式時間複雜度的技巧包括：選擇合適的容器（如vector、list）以最佳化資料儲存和管理。利用高效演算法（如快速排序）以減少計算時間。消除多重運算以減少重複計算。利用條件分支以避免不必要的計算。透過使用更快的演算法（如二分搜尋）來優化線性搜尋。

C++中如何優化多執行緒程式的效能？ Jun 05, 2024 pm 02:04 PM

優化C++多執行緒效能的有效技術包括：限制執行緒數量，避免爭用資源。使用輕量級互斥鎖，減少爭用。優化鎖的範圍，最小化等待時間。採用無鎖定資料結構，提高並發性。避免忙等，透過事件通知執行緒資源可用性。

PHP 數組轉物件對效能的影響是什麼？ Apr 30, 2024 am 08:39 AM

在PHP中，陣列到物件的轉換會對效能產生影響，主要受陣列大小、複雜度、物件類別等因素影響。為了優化效能，可以考慮使用自訂迭代器、避免不必要的轉換、批次轉換數組等技巧。

如何使用基準測試來評估Java函數的效能？ Apr 19, 2024 pm 10:18 PM

基準測試Java函數效能的方法是使用Java微基準測試套件（JMH）。具體步驟包括：新增JMH依賴項到專案中。建立一個新的Java類，用@State註解表示基準測試方法。在類別中寫基準測試方法，用@Benchmark註解。使用JMH命令列工具執行基準測試。

Java框架的效能比較 Jun 04, 2024 pm 03:56 PM

根據基準測試，對於小型、高效能應用程序，Quarkus（快速啟動、低記憶體）或Micronaut（TechEmpower優異）是理想選擇。 SpringBoot適用於大型、全端應用程序，但啟動時間和記憶體佔用稍慢。

C++與其他語言的效能比較 Jun 01, 2024 pm 10:04 PM

在開發高效能應用程式時，C++的效能優於其他語言，尤其在微基準測試中。在宏基準測試中，其他語言如Java和C#的便利性和最佳化機制可能表現較好。在實戰案例中，C++在影像處理、數值計算和遊戲開發中表現出色，其對記憶體管理和硬體存取的直接控制帶來明顯的效能優勢。

See all articles

一篇學會本地知識庫對LLM的效能優化

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題