Gemeinschaft

Lernen

Tools-Bibliothek

KI-Tools

Freizeit

Deutsch

Heim > Technologie-Peripheriegeräte > KI > Feinabstimmungs-PHI-3.5 im E-Commerce-Klassifizierungsdatensatz

Feinabstimmungs-PHI-3.5 im E-Commerce-Klassifizierungsdatensatz

Jennifer Aniston

Freigeben： 2025-03-03 09:36:12

Original

216 Leute haben es durchsucht

Microsofts Phi-3,5-Familie von großer Sprachmodellen (LLMs) tritt neben Meta AI in die Wettbewerbsarena ein. Dieses Tutorial beschreibt ein phi-3.5-Modell für die E-Commerce-Produktklassifizierung unter Verwendung von Textbeschreibungen. Wir werden das Modellladen, Feinabstimmung mit LORA (Anpassung mit niedriger Rang), das Zusammenführen der angepassten Gewichte mit dem Basismodell und Bereitstellung auf dem Umarmungsgesicht für Cloud-Zugänglichkeit abdecken.

Dieses Tutorial untersucht die Phi-3,5-Modellfamilie von Microsoft und umfasst den PHI-3,5-Mini, Phi-3,5-Vision und das MIE-von Experten (MOE), Phi-3,5-MOE.

phi-3,5-mini zeichnet sich in mehrsprachiger Unterstützung mit einer Kontextlänge von 128K aus und liefert die Leistung mit größeren Modellen vergleichbar. Die PHI-3,5-Vision ist ein leichtes multimodales Modell, das im Multi-Rahmen-Bildverständnis geschickt ist. Phi-3,5-MOE mit 16 Experten und 6,6 Milliarden Parametern bietet hohe Leistung und robuste Sicherheitsfunktionen.

Das Tutorial konzentriert

Zugriff auf und verwenden Sie phi-3,5-mini-in-struktur

Dieser Abschnitt führt Sie durch das Laden des Modells und die Durchführung von Inferenz auf der Kaggle -Plattform.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Installieren Sie die erforderlichen Python -Pakete:
und transformers. accelerate
Laden Sie das Modell und den Tokenizer mit der Bibliothek
. Anschließend wird eine Text-Generationspipeline erstellt. transformers
Inferenz wird mit einer Stichprobenabfrage demonstriert ("Was ist das höchste Gebäude der Welt?"). Die Antwort des Modells ist genau und detailliert.
benutzerdefinierte Eingabeaufforderung Beispiele zeigen die Fähigkeit des Modells, Kundeninteraktionen in einer Call Center -Einstellung zu klassifizieren und betrügerische Aktivitäten effektiv zu identifizieren.
Für die Unterstützung beim Kaggle -Setup finden Sie das bereitgestellte Kaggle -Notizbuch.

feinabstimmig phi-3,5-mini-instruktur für die E-Commerce-Klassifizierung

In diesem Abschnitt wird beschrieben

Einrichten eines Kaggle -Notizbuchs mit GPU -Beschleunigung, Umarmung und Gewichten und Verzerrungen API -Tasten konfiguriert.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Installieren Sie die erforderlichen Pakete:

, bitsandbytes, transformers und accelerate. Gewichte und Verzerrungen Die Integration ist ebenfalls konfiguriert. peft trl

Laden und Vorverarbeitung des E-Commerce-Datensatzes (Produktbeschreibungen und Kategorien). Der Datensatz ist gemischt und eine Untergruppe wird für schnelleres Training verwendet.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Laden Sie das 4-Bit-quantisierte Modell und den Tokenizer.
Das Modell wird vor Feinabstimmung bewertet, um eine Basisleistung zu ermitteln.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

lora ist so konfiguriert, dass sie nur spezifische Modellschichten feinstimmen und die Trainingseffizienz verbessern. Hyperparameter sind für den Trainingsprozess festgelegt.
Ein beaufsichtigter Fine-Tuning-Trainer (SFT) wird initialisiert.
Das Modell wird mit der Funktion
trainiert. Der Trainingsverlust wird über Gewichte und Verzerrungen überwacht. trainer.train()

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Das fein abgestimmte Modell und Tokenizer werden gespeichert.
für einfachere Feinabstimmungsalternativen finden Sie in den vorgeschlagenen Tutorials.

Zusammenführen und exportieren Sie das fein abgestimmte Modell

In diesem Abschnitt wird das Verschmelzung der Lora mit dem Basismodell erläutert und es zum Umarmungsgesicht drückt.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Die umarmende Gesichts -API -Schlüssel wird als Umgebungsvariable festgelegt. Die erforderlichen Pakete sind installiert.
Die Basis- und Feinabstimmungsmodelle sind geladen.
Die Lora wird mit dem Basismodell mit
und PeftModel.from_pretrained(). model.merge_and_unload() verschmolzen
Das fusionierte Modell wird getestet, um die Funktionalität zu überprüfen.
Das fusionierte Modell und Tokenizer werden lokal gespeichert und dann in den umarmenden Gesichtszentrum gedrückt.

Fine-Tuning Phi-3.5 on E-Commerce Classification Dataset

Schlussfolgerung

Dieses Tutorial zeigte die Effizienz und Fähigkeiten der Phi-3,5-Modelle von Microsoft, insbesondere von pHi-3,5-mini-Einbrüchen, und zeigte eine signifikante Leistungsverbesserung durch Feinabstimmung und LORA-Anpassung. Der Prozess der Bereitstellung des fein abgestimmten Modells für das Umarmungsgesicht ist ebenfalls detailliert, wodurch das Modell für eine breitere Verwendung leicht zugänglich ist. Das Tutorial schließt mit dem Vorschlag weiterer LLM -Projektideen.

Das obige ist der detaillierte Inhalt vonFeinabstimmungs-PHI-3.5 im E-Commerce-Klassifizierungsdatensatz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Vorheriger Artikel：Swarm Intelligence Algorithmen: Drei Python -Implementierungen Nächster Artikel：Runway Act-One Guide: Ich habe mich gefilmt, um es zu testen

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

Aktuelle Ausgaben

function_exists() kann die benutzerdefinierte Funktion nicht ermitteln Funktionstest () {Verwendung der Verwendung durch -Durch -Durch -Durch -Durch -Durch -Durc...

Aus 2024-04-29 11:01:01

0

3

2878

So zeigen Sie die mobile Version von Google Chrome an Hallo Lehrer, wie kann ich Google Chrome in eine mobile Version umwandeln?

Aus 2024-04-23 00:22:19

0

11

3061

Das untergeordnete Fenster bedient das übergeordnete Fenster, aber die Ausgabe antwortet nicht. Die ersten beiden Sätze sind ausführbar, der letzte Satz jedoch nicht.

Aus 2024-04-19 15:37:47

0

1

2511

Im übergeordneten Fenster erfolgt keine Ausgabe document.onclick = function(){ window.opener.document.write('Ich bin die Ausgabe des unter...

Aus 2024-04-18 23:52:34

0

1

2453

Wo gibt es die Kursunterlagen zum CSS-Mindmapping? Kursunterlagen

Aus 2024-04-16 10:10:18

0

0

2482

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage