Die Tsinghua-Universität und andere Universitäten bringen das erste Open-Source-Wasserzeichen-Toolkit für große Modelle, MarkLLM, auf den Markt, das fast zehn der neuesten Wasserzeichen-Algorithmen unterstützt-KI-php.cn

Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse der Einreichung: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com

Dieser Artikel wurde gemeinsam von der Tsinghua University, der Shanghai Jiao Tong University, der University of Sydney, der UCSB, der Chinese University of Hong Kong und der Hong Kong University of Science erstellt und Technologie sowie der Hong Kong University of Science and Technology (Guangzhou). Zu den Hauptautoren gehören: Pan Leyi (Erstautor), ein Bachelor-Student an der Tsinghua-Universität, dessen Forschungsrichtung auf groß angelegten Modellwasserzeichen liegt; Liu Aiwei, ein Doktorand an der Tsinghua-Universität, dessen Forschungsrichtung auf sicheren und vertrauenswürdigen großmaßstäblichen Modellen liegt ; He Zhiwei, ein Doktorand an der Shanghai Jiao Tong University, seine Forschungsrichtung ist große Modellwasserzeichen, große Modellintelligenz usw.; Gao Zitian, ein Student an der Universität von Sydney, Forschungsrichtung ist große Modellwasserzeichen; , UCSB-Doktorand, Forschungsrichtung ist vertrauenswürdige generative KI usw.; Hu Xuming, Hong Kong University of Science and Technology/Hong Kong Science and Technology Er ist Assistenzprofessor an der Universität Guangzhou (Guangzhou) und seine Forschungsinteressen umfassen: sichere und vertrauenswürdige große Modelle, Informationsextraktion usw. Wen Lijie ist ständiger außerordentlicher Professor an der Tsinghua-Universität und seine Forschungsinteressen umfassen Process Mining und Verarbeitung natürlicher Sprache.

In diesem Artikel wird ein Open-Source-Modelldruckalgorithmus vorgestellt, der gemeinsam von der Tsinghua-Universität und anderen Universitäten eingeführt wurde. MarkLLM bietet ein einheitliches Framework zur Implementierung von Modelldruckalgorithmen, eine intuitive Visualisierung von Druckalgorithmusmechanismen, Beispiele und systematische Bewertungsmodule, die es Forschern ermöglichen sollen, die neuesten Entwicklungen in der Drucktechnologie einfach zu experimentieren, zu verstehen und zu bewerten. Durch MarkLLM hofft der Autor, das Verständnis der Öffentlichkeit für die Modelldrucktechnologie zu vertiefen und gleichzeitig den Forschern Komfort zu bieten sowie die Entwicklung und Förderung verwandter Forschung zu fördern.

Theorie⽂Name: MarkLLM: Ein Open-Source-Toolkit für LLM-Wasserzeichen
Theorie⽂Link: https://arxiv.org/abs/2405.10051
Code-Repository: https:/ /github.com/THU- BPM/MarkLLM

⼯Entwicklungsstand der Drucktechnologie für große Modelle und noch bestehende Probleme

⼤Der Druck großer Modelle ist eine kürzlich aufkommende Technologie, mit der Modelle im Modell erstellt werden können In diesem Prozess werden spezifische Funktionen implementiert, um die Identifizierung und Quellenverfolgung organischer Texte zu ermöglichen. Es kann in Szenarien wie der Erkennung gefälschter Nachrichten, der Aufrechterhaltung der akademischen Integrität sowie dem Schutz des Urheberrechts von Daten und Modellen eingesetzt werden.

⽬Der aktuelle Mainstream-Algorithmus zur Prägung großer Modelle besteht darin, Prägungen in der Inferenzphase großer Modelle zu implantieren. Diese Art von Methode ist hauptsächlich in zwei Hauptalgorithmusfamilien unterteilt:

KGW-Familie: hinzugefügt durch Vorbewertungsvektor Drucken Sie die Wortliste aus, teilen Sie sie in rote und grüne Listen auf und fügen Sie den grünen Wörtern eine Voreingenommenheit hinzu, sodass die Ausgabe grüne Wörter bevorzugt Prozess: Betten Sie das Wasserzeichen ein, indem Sie den Wasserzeichentext für die Zufallszahl relevanter machen.
Wie alle neuen Technologien steht auch die chinesische Modell-Wasserzeichentechnologie vor einigen Herausforderungen bei der Verwendung und dem Verständnis.

Es entstehen ständig verschiedene Wasserzeichenalgorithmen für große Modelle. Ihre Implementierung basiert jedoch größtenteils auf den eigenen Bedürfnissen des Autors und es mangelt an einem einheitlichen Klassen- und Aufrufschnittstellendesign, was von Forschern und der Öffentlichkeit große Anstrengungen erfordert, um diese Algorithmen zu verwenden und zu reproduzieren.

2. Wie kann man den internen Mechanismus jedes großen Modellwasserzeichenalgorithmus intuitiv verstehen?

⼼Der zugrunde liegende Mechanismus des Wasserzeichenalgorithmus für große Modelle ist relativ komplex und beinhaltet den Eingriff der Bewertungsvektorgenerierung und des Samplingprozesses in den Textgenerierungsprozess des großen Modells, was für Forscher und die Öffentlichkeit nicht leicht zu verstehen ist.

3. Wie kann man verschiedene Wasserzeichenalgorithmen für große Modelle bequem und umfassend bewerten?

Bewertungsperspektiven und -indikatoren sind vielfältig (einschließlich Erkennbarkeit, Robustheit, Auswirkungen auf die Textqualität usw.), und eine Bewertung umfasst mehrere Schritte, was es äußerst schwierig macht, die Leistung des Algorithmus umfassend und schnell zu bewerten.

MarkLLM: Das erste multifunktionale Open-Source-Wasserdruck-Toolpaket für große Modelle

Als Reaktion auf die drei gerade genannten Probleme hat der Autor ein MarkLLM-Toolpaket für die Wasserdrucktechnologie für große Sprachmodelle entworfen und implementiert. Die Hauptbeiträge von MarkLLM lassen sich wie folgt zusammenfassen:

1. Funktional einheitliches Implementierungsframework für große Modelldruckalgorithmen: Unterstützt zwei wichtige Druckalgorithmusfamilien (KGW-Familie und Christ-Familie) 9 spezifische Algorithmen.

⼼Konsistente, benutzerfreundliche Aufrufoberfläche der obersten Ebene: 1 Codezeile zum Implementieren verschiedener Vorgänge wie dem Hinzufügen von Wasserzeichen und der Erkennung von Wasserzeichen.

Maßgeschneiderte Lösung zur Visualisierung von Wasserprägealgorithmen für große Modelle: Ermöglicht Benutzern die Visualisierung der internen Mechanismen verschiedener Wasserprägealgorithmen für große Modelle unter verschiedenen Konfigurationen.

Umfassendes und systematisches Evaluierungsmodul für große Modelldruckalgorithmen: einschließlich insgesamt 12 Evaluierungstools, die 3 Evaluierungswinkel abdecken, und zwei Arten automatisierter Evaluierungspipelines.

2. Design-Abschluss: Modulares, lose gekoppeltes Architekturdesign mit extremer Skalierbarkeit und Flexibilität.

3. Experimenteller Aspekt: Der Autor nutzte MarkLLM als Forschungsinstrument und führte drei umfassende Experimente zu den 9 unterstützten Algorithmen durch, die gleichzeitig die Praktikabilität von MarkLLM bewiesen und wertvolle Daten lieferten Referenz.

4. Auswirkungen auf die Open-Source-Community⼒

: Es hat über 140 Sterne erhalten und Kollegen dazu gebracht, über Pull Request Code beizutragen. und kommunizieren und diskutieren Sie in der Themenspalte.

Der Autor hofft aufrichtig, dass das MarkLLM-Toolkit nicht nur den Forschern Komfort bietet, sondern auch das Verständnis und die Beteiligung der Öffentlichkeit an der Wasserzeichentechnologie für große Sprachmodelle verbessert und die Kommunikation zwischen der akademischen Gemeinschaft und der Öffentlichkeit fördert auf Technologie, fördern die Weiterentwicklung der Wasserzeichenforschung und -anwendung für große Sprachmodelle und tragen zur sicheren Verwendung großer Sprachmodelle bei.

Die Tsinghua-Universität und andere Universitäten bringen das erste Open-Source-Wasserzeichen-Toolkit für große Modelle, MarkLLM, auf den Markt, das fast zehn der neuesten Wasserzeichen-Algorithmen unterstützt Der Autor heißt alle herzlich willkommen, wertvolle Meinungen abzugeben, sich auszutauschen und voneinander zu lernen, und begrüßt auch Codebeiträge über Pull-Requests, um durch die gemeinsamen Bemühungen aller ein besseres Ökosystem für die Wasserzeichentechnologie für große Modelle aufrechtzuerhalten!

Das obige ist der detaillierte Inhalt vonDie Tsinghua-Universität und andere Universitäten bringen das erste Open-Source-Wasserzeichen-Toolkit für große Modelle, MarkLLM, auf den Markt, das fast zehn der neuesten Wasserzeichen-Algorithmen unterstützt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!