AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
本文由清華大學、上海交通大學、雪梨大學、UCSB、香港中文大學、香港科技大學、香港科技大學(廣州)聯合完成。主要作者包括:潘樂怡(第一作者),清華大學本科生,研究方向為大模型水印等;劉瑤瑋,清華大學博士生,研究方向為安全可信大模型等;何志威,上海交通大學博士生,研究方向為大模型水印、大模型智能體等;高梓添,悉尼大學本科生,研究方向為大模型水印;趙宣棟,UCSB博士生,研究方向為可信生成式AI等;胡旭明,香港科技大學/香港科技大學(廣州)助理教授,研究方向為安全可信大模型、資訊抽取等;聞立傑, 清華大學長聘副教授,研究方向為流程挖掘,自然語言處理。
本文介紹了由清華等校共同推出的個開源的模型印演算法。 MarkLLM提供了統的模型印演算法實現框架、直觀的印演算法機制視覺化、案例以及系統性的評估模組,旨在持研究員便地實驗、理解和評估最新的印技術展。透過MarkLLM,作者期望在給研究者提供便利的同時加深公眾對模型印技術的認知形成,進⾛推進相關研究的發展和推⼴應。
理論⽂名稱:MarkLLM: An Open-Source Toolkit for LLM Watermarking
理論⽂鏈接:https://arxiv.org/abs/2405.10051
#程式碼倉庫:https://github.com/THU- BPM/MarkLLM
##⼤模型⽔印技術的發展現況& 仍⾯臨的問題
⼤模型⽔印是近期新興的⼀項技術,透過在模型⽣成⽂本過程中植⼊特定的特徵,來實現機⽣⽂本的辨別與來源追溯。它可⽤於假新聞檢測、維護學 術誠信、資料和模型版權保護等場景。
⽬前主流的⼤模型⽔印演算法是在⼤模型推理階段植⼊⽔印,這類⽅法主要分為兩⼤演算法家族:
####Christ 家族:在評分向量⽣成後,⽤偽隨機數⼲預採樣過程,使⽔印⽂本與此隨機數更相關,以此植⼊⽔印。 ############然⽽,就像所有新興技術⼀樣,⼤語⾔模型⽔印技術在使⽤和理解上也⾯臨⼀些挑戰。 ######1. 如何方便地使⽤各個⼤模型⽔印演算法進⾏⽔印新增與偵測? ######各類別⼤模型⽔印演算法不斷湧現。然⽽它們的實現⼤都基於作者⾃⾝的需求,缺乏統⼀的類別和調⽤接⼝設計,使得研究⼈員和⼤眾需要投⼊⼤量精⼒去使⽤和復現這些演算法。 ######2. 如何直觀地理解各個⼤模型⽔印演算法的內部機制? ######⼤模型⽔印演算法的底層機制相對複雜,涉及對⼤模型⽣成⽂本過程中打分向量⽣成以及採樣過程的⼲預,不便於研究者和⼤眾理解。 ######3. 如何便利、全⾯的評估各個⼤模型⽔印演算法? ######評估⻆度和指標多樣(包含可偵測性、穩健性、對⽂本品質的影響等),且⼀次評估涉及多步驟,全⾯快速評估演算法效能極具挑戰。 #########MarkLLM:⾸個開源⼤模型⽔印多功能⼯具套件#########針對剛才提到的3 個問題,作者設計並實現了⾯向⼤語⾔模型⽔印技術的⼯具包MarkLLM。 ######MarkLLM 的主要貢獻可總結如下:#########1. 功能⻆度###############統⼀的⼤模型⽔印演算法實現框架:⽀持兩個關鍵⽔印演算法家族(KGW 家族和Christ 家族)的9 種具體演算法。 ############⼀致、⽤⼾友善的頂層調⽤接⼝:1 ⾏程式碼實作新增⽔印、偵測⽔印等各類操作。 ###
客製化的⼤模型⽔印演算法機制可視化解決⽅案:使⽤⼾能夠在各種配置下可視化不同⼤模型⽔印演算法的內部機制。
全⾯、系統的⼤模型⽔印演算法評估模組:包含涵蓋3 個評估⻆度的共12個評估⼯具,以及兩類⾃動化評估流⽔線。
2.設計 ⻆度:模組化、鬆散耦合架構設計,具有極⾼的可擴展性和靈活性。
3. 實驗⻆度:作者⽤ MarkLLM 作為研究⼯具,對⽀持的9 種演算法做了3 個評估⻆度的全⾯實驗,在證明MarkLLM 的實⽤性的同時,為後續研究提供了寶貴的資料參考。
4. 對開源社群的影響⼒:MarkLLM 在GitHub 上線以來已經獲得了較多關注,⽬前已有140 + stars, 並吸引了同⾏透過Pull Request 進⾏程式碼貢獻,以及在issue 欄⽬進⾏交流討論。
作者衷⼼希望MarkLLM ⼯具包在為研究⼈員提供便利的同時,提⾼⼤眾對⼤語⾔模型⽔印技術的理解和參與度,促進學術界和公眾之間就該技術達成共識,推動⼤語⾔模型⽔印研究和應⽤的進⼀步發展,為⼤語⾔模型使⽤安全貢獻⼒量。
作者真誠歡迎⼤家提出寶貴意⻅、相互交流學習, 也⼗分歡迎透過 pull request 貢獻程式碼,透過⼤家的共同努⼒維護更好的⼤模型⽔印技術⽣態!
以上是清華等大學推出首個開源大模型浮水印工具包MarkLLM,支援近10種最新浮水印演算法的詳細內容。更多資訊請關注PHP中文網其他相關文章!