Heim Betrieb und Instandhaltung Sicherheit Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Jun 12, 2023 am 09:23 AM
优化 性能 知识库

Eine Feinabstimmungsschulung, die 220 Stunden dauerte, wurde gestern abgeschlossen. Die Hauptaufgabe bestand darin, ein Dialogmodell auf CHATGLM-6B zu optimieren, das Datenbankfehlerinformationen genauer diagnostizieren kann.

Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Allerdings war das Endergebnis dieser Schulung, auf die ich fast zehn Tage gewartet habe, enttäuschend. Im Vergleich zu der Schulung, die ich zuvor mit einer kleineren Stichprobenabdeckung durchgeführt habe, war der Unterschied ziemlich groß.

Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Dieses Ergebnis ist immer noch etwas enttäuschend. Dieses Modell hat grundsätzlich keinen praktischen Wert. Es scheint, dass die Parameter und der Trainingssatz neu angepasst werden müssen und das Training erneut durchgeführt werden muss. Das Training großer Sprachmodelle ist ein Wettrüsten, und ohne gute Ausrüstung ist es unmöglich zu spielen. Es scheint, dass wir auch die Laborausrüstung aufrüsten müssen, sonst werden wir ein paar zehn Tage verschwenden.

Nach den kürzlich gescheiterten Feinabstimmungsschulungen zu urteilen, ist die Feinabstimmungsschulung kein einfacher Weg. Verschiedene Aufgabenziele werden für das Training miteinander kombiniert. Unterschiedliche Aufgabenziele erfordern möglicherweise unterschiedliche Trainingsparameter, sodass der endgültige Trainingssatz nicht in der Lage ist, die Anforderungen bestimmter Aufgaben zu erfüllen. Daher ist PTUNING nur für eine sehr bestimmte Aufgabe geeignet und nicht unbedingt für gemischte Aufgaben. Modelle, die auf gemischte Aufgaben ausgerichtet sind, müssen möglicherweise FINETUNE verwenden. Das ähnelt dem, was alle sagten, als ich vor ein paar Tagen mit einem Freund kommunizierte.

Da das Trainieren des Modells relativ schwierig ist, haben einige Leute es tatsächlich aufgegeben, das Modell selbst zu trainieren, und vektorisieren stattdessen die lokale Wissensbasis für einen genaueren Abruf und verwenden dann AUTOPROMPT, um aus den Abrufergebnissen automatische Eingabeaufforderungen zu generieren . Fragen Sie nach dem Sprachmodell. Dieses Ziel lässt sich mit Langchain leicht erreichen.

Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Das Arbeitsprinzip besteht darin, das lokale Dokument als Text über den Loader zu laden, den Text dann in Textfragmente aufzuteilen und diese nach der Codierung zur Verwendung in Abfragen in den Vektorspeicher zu schreiben. Nachdem die Abfrageergebnisse vorliegen, werden über die Eingabeaufforderungsvorlage automatisch Eingabeaufforderungen zum Stellen von Fragen an LLM erstellt, und LLM generiert die endgültige Antwort.

Ein weiterer wichtiger Punkt in dieser Arbeit ist die genauere Suche nach Wissen in der lokalen Wissensdatenbank. Dies wird durch die Vektorisierung und Suche nach lokalen Wissensdatenbanken in Chinesisch erreicht Es gibt viele Lösungen für Englisch. Sie können eine auswählen, die besser zu Ihrer Wissensbasis passt.


Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Das Obige ist eine Frage und Antwort, die auf Vicuna-13b über die Wissensdatenbank zu OB durchgeführt wurde. Das Obige ist die Antwort auf die Möglichkeit, LLM direkt zu nutzen, ohne die lokale Wissensdatenbank zu nutzen. Das Folgende ist die Ladeantwort nach dem Zugriff auf die lokale Wissensdatenbank. Es ist ersichtlich, dass die Leistungsverbesserung ziemlich offensichtlich ist.

Ein Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können

Schauen wir uns jetzt das ORA-Fehlerproblem an. Nach dem Laden der lokalen Wissensdatenbank war die Antwort immer noch recht zufriedenstellend Text sind ebenfalls Fehler in unserer Wissensdatenbank. Tatsächlich wird der von PTUNING verwendete Trainingssatz auch über diese lokale Wissensdatenbank generiert.

Wir können einige Erfahrungen aus den Fallstricken sammeln, auf die wir in letzter Zeit gestoßen sind. Erstens ist der Schwierigkeitsgrad des Ptunings viel höher als wir dachten. Obwohl für das Ptuning weniger Ausrüstung erforderlich ist als für das Finetuning, ist der Trainingsschwierigkeit überhaupt nicht gering. Zweitens ist es gut, die lokale Wissensdatenbank über Langchain und Autoprompt zu nutzen, um die LLM-Funktionen zu verbessern. Bei den meisten Unternehmensanwendungen sollten Sie in der Lage sein, entsprechende Ergebnisse zu erzielen, solange die lokale Wissensdatenbank sortiert und eine geeignete Vektorisierungslösung ausgewählt wird sind nicht schlechter als der PTUNING/FINETUNE-Effekt. Drittens ist, wie bereits beim letzten Mal erwähnt, die Fähigkeit des LLM von entscheidender Bedeutung. Als Basismodell muss ein leistungsfähiges LLM ausgewählt werden. Jedes eingebettete Modell kann die Fähigkeiten nur teilweise verbessern und kann keine entscheidende Rolle spielen. Viertens verfügt Vicuna-13b für datenbankbezogenes Wissen über wirklich gute Fähigkeiten.

Ich muss heute Morgen früh zum Kunden gehen, um eine Kommunikation zu führen, deshalb werde ich nur ein paar Sätze schreiben. Wenn Sie dazu eine Meinung haben, hinterlassen Sie bitte eine Nachricht zur Diskussion (die Diskussion ist nur für Sie und mich sichtbar). Ich hoffe, dass es Mitreisende gibt, die mir einen Rat geben können.

Das obige ist der detaillierte Inhalt vonEin Artikel darüber, wie Sie die Leistung von LLM mithilfe einer lokalen Wissensdatenbank optimieren können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Leistungsvergleich verschiedener Java-Frameworks Leistungsvergleich verschiedener Java-Frameworks Jun 05, 2024 pm 07:14 PM

Leistungsvergleich verschiedener Java-Frameworks: REST-API-Anforderungsverarbeitung: Vert.x ist am besten, mit einer Anforderungsrate von 2-mal SpringBoot und 3-mal Dropwizard. Datenbankabfrage: HibernateORM von SpringBoot ist besser als ORM von Vert.x und Dropwizard. Caching-Vorgänge: Der Hazelcast-Client von Vert.x ist den Caching-Mechanismen von SpringBoot und Dropwizard überlegen. Geeignetes Framework: Wählen Sie entsprechend den Anwendungsanforderungen. Vert.x eignet sich für leistungsstarke Webdienste, SpringBoot eignet sich für datenintensive Anwendungen und Dropwizard eignet sich für Microservice-Architekturen.

PHP-Array-Schlüsselwertumdrehen: Vergleichende Leistungsanalyse verschiedener Methoden PHP-Array-Schlüsselwertumdrehen: Vergleichende Leistungsanalyse verschiedener Methoden May 03, 2024 pm 09:03 PM

Der Leistungsvergleich der PHP-Methoden zum Umdrehen von Array-Schlüsselwerten zeigt, dass die Funktion array_flip() in großen Arrays (mehr als 1 Million Elemente) eine bessere Leistung als die for-Schleife erbringt und weniger Zeit benötigt. Die for-Schleifenmethode zum manuellen Umdrehen von Schlüsselwerten dauert relativ lange.

C++-Programmoptimierung: Techniken zur Reduzierung der Zeitkomplexität C++-Programmoptimierung: Techniken zur Reduzierung der Zeitkomplexität Jun 01, 2024 am 11:19 AM

Die Zeitkomplexität misst die Ausführungszeit eines Algorithmus im Verhältnis zur Größe der Eingabe. Zu den Tipps zur Reduzierung der Zeitkomplexität von C++-Programmen gehören: Auswahl geeigneter Container (z. B. Vektor, Liste) zur Optimierung der Datenspeicherung und -verwaltung. Nutzen Sie effiziente Algorithmen wie die schnelle Sortierung, um die Rechenzeit zu verkürzen. Eliminieren Sie mehrere Vorgänge, um Doppelzählungen zu reduzieren. Verwenden Sie bedingte Verzweigungen, um unnötige Berechnungen zu vermeiden. Optimieren Sie die lineare Suche, indem Sie schnellere Algorithmen wie die binäre Suche verwenden.

Wie kann die Leistung von Multithread-Programmen in C++ optimiert werden? Wie kann die Leistung von Multithread-Programmen in C++ optimiert werden? Jun 05, 2024 pm 02:04 PM

Zu den wirksamen Techniken zur Optimierung der C++-Multithread-Leistung gehört die Begrenzung der Anzahl der Threads, um Ressourcenkonflikte zu vermeiden. Verwenden Sie leichte Mutex-Sperren, um Konflikte zu reduzieren. Optimieren Sie den Umfang der Sperre und minimieren Sie die Wartezeit. Verwenden Sie sperrenfreie Datenstrukturen, um die Parallelität zu verbessern. Vermeiden Sie geschäftiges Warten und benachrichtigen Sie Threads über Ereignisse über die Ressourcenverfügbarkeit.

Wie verwende ich Benchmarks, um die Leistung von Java-Funktionen zu bewerten? Wie verwende ich Benchmarks, um die Leistung von Java-Funktionen zu bewerten? Apr 19, 2024 pm 10:18 PM

Eine Möglichkeit, die Leistung von Java-Funktionen zu bewerten, ist die Verwendung der Java Microbenchmark Suite (JMH). Zu den spezifischen Schritten gehören: Hinzufügen von JMH-Abhängigkeiten zum Projekt. Erstellen Sie eine neue Java-Klasse und versehen Sie sie mit @State, um die Benchmark-Methode darzustellen. Schreiben Sie die Benchmark-Methode in die Klasse und kommentieren Sie sie mit @Benchmark. Führen Sie den Benchmark mit dem JMH-Befehlszeilentool aus.

Welche Auswirkungen hat die Konvertierung von PHP-Arrays in Objekte auf die Leistung? Welche Auswirkungen hat die Konvertierung von PHP-Arrays in Objekte auf die Leistung? Apr 30, 2024 am 08:39 AM

In PHP wirkt sich die Konvertierung von Arrays in Objekte auf die Leistung aus, die hauptsächlich von Faktoren wie Array-Größe, Komplexität, Objektklasse usw. beeinflusst wird. Um die Leistung zu optimieren, sollten Sie benutzerdefinierte Iteratoren verwenden und unnötige Konvertierungen, Batch-Konvertierung von Arrays und andere Techniken vermeiden.

Leistungsvergleich von C++ mit anderen Sprachen Leistungsvergleich von C++ mit anderen Sprachen Jun 01, 2024 pm 10:04 PM

Bei der Entwicklung leistungsstarker Anwendungen übertrifft C++ andere Sprachen, insbesondere bei Mikro-Benchmarks. Bei Makro-Benchmarks können die Komfort- und Optimierungsmechanismen anderer Sprachen wie Java und C# besser abschneiden. In der Praxis schneidet C++ bei der Bildverarbeitung, bei numerischen Berechnungen und bei der Spieleentwicklung gut ab, und die direkte Steuerung der Speicherverwaltung und des Hardwarezugriffs bringt offensichtliche Leistungsvorteile.

Welche Möglichkeiten gibt es, Ineffizienzen in PHP-Funktionen zu beheben? Welche Möglichkeiten gibt es, Ineffizienzen in PHP-Funktionen zu beheben? May 02, 2024 pm 01:48 PM

Fünf Möglichkeiten zur Optimierung der PHP-Funktionseffizienz: Vermeiden Sie unnötiges Kopieren von Variablen. Verwenden Sie Referenzen, um das Kopieren von Variablen zu vermeiden. Vermeiden Sie wiederholte Funktionsaufrufe. Einfache Inline-Funktionen. Schleifen mithilfe von Arrays optimieren.

See all articles