PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren-KI-php.cn

Die Landschaft der KI entwickelt sich schnell, und Sprachmodelle, insbesondere diejenigen, die für die Argumentation und Aufgaben des Problemlösen entwickelt wurden, stehen im Mittelpunkt dieser Revolution. Ein solcher Durchbruch in AI ist PHI-4, ein von Microsoft Research entwickeltes Parametermodell von 14 Milliarden Billionen. Was den PHI-4 von seinen Vorgängern und anderen Modellen unterscheidet, ist der innovative Trainingsansatz-insbesondere die Verwendung synthetischer Daten. Durch die Priorisierung der Datenqualität über die bloße Quantität zeigt PHI-4 bemerkenswerte Verbesserungen bei den Argumentationsfunktionen, die Beantwortung von Fragen und Codierungsaufgaben.

In diesem Blog werden wir den Phi-4 im Detail untersuchen und alle Komponenten seiner Architektur, des Schulungsprozesses und seiner Innovationen nach der Ausbildung analysieren. Wir werden seine wichtigsten Stärken aufschlüsseln, Verbesserungsbereiche diskutieren und erklären, wie es viele andere Sprachmodelle übertrifft - selbst die viel größeren Größe. Am Ende dieses tiefen Tauchgangs werden Sie verstehen, warum PHI-4 nicht nur ein weiteres Modell, sondern ein wahrer Sprung nach vorne im Bereich der Verarbeitung natürlicher Sprache (NLP) ist.

Lernziele

Erfahren Sie, warum synthetische Daten für die Entwicklung von PHI-4 von entscheidender Bedeutung sind und wie sie die Leistung bei langen Kontextaufgaben stärken.
Erfahren Sie, wie das Team den PHI-4 mit verschiedenen Datenquellen, einschließlich synthetischer und nicht synthetischer Daten, in drei Trainingsphasen ausbildet.
Entdecken Sie, wie die Kontextlänge von PHI-4 von 4K auf 16K-Token in der Midtraining steigt und welche Auswirkungen dies auf die Leistung ist.
Sehen Sie, wie Phi-4 eine Bewertung bei realen Aufgaben wie Fragen beantwortet, zusammenfasst und die Generation von Abrufen abgerufen hat, und vergleichen Sie deren Leistung.
Holen Sie sich einen Leitfaden zum Ausführen von PHI-4 lokal, abdecken technische Setup, Systemanforderungen und Herausforderungen wie Überanpassung und Datenkontamination.

Dieser Artikel wurde als Teil des Data Science -Blogathons veröffentlicht.

Inhaltsverzeichnis

Warum synthetische Daten wichtig?
Warum sind synthetische Daten für PHI-4 der Schlüssel?
Wie wurde Phi-4 ausgebildet?
Erkenntnisse aus der Phase der Mitte der Schulung
Ergebnisse und Überlegungen aus dem Training nach dem Training
Leistung bei wichtigen Benchmarks
Wie man phi-4 lokal ausführt
Herausforderungen: Umgang mit Überanpassung und Datenkontamination
Abschluss
Häufig gestellte Fragen

Warum synthetische Daten wichtig?

Im Kern ist Phi-4 ein 14-Milliarden-Parametersprachenmodell, das von Microsoft Research entwickelt wurde. Das Modell baut auf den Erfolgen früherer Iterationen in der PHI-Familie wie PHI-3 auf, führt jedoch mehrere wichtige Innovationen ein, die seine Leistung bei der argumentierten Aufgaben erheblich verbessern. Im Gegensatz zu vielen anderen großsprachigen Modellen (LLMs), die in erster Linie auf massiven Mengen an organischen Daten (wie Webinhalten, Büchern und Code-Repositories) angewiesen sind, enthält PHI-4 strategisch eine große Menge an synthetischen Daten in seine Trainingspipeline. Diese Fokussierung auf synthetische Daten in Kombination mit anderen Trainingsinnovationen ermöglicht es PHI-4, in Schlüsselbereichen eine bessere Leistung zu erzielen-insbesondere die Beantwortung von Fragen zu stammbedingten Fragen und eine komplexe Problemlösung.

Warum sind synthetische Daten für PHI-4 der Schlüssel?

In der KI -Community sind Daten das Lebenselixier von Trainingsmodellen. In der Regel werden LLMs mit massiven Datensätzen trainiert, die aus dem Web gekratzt oder aus Büchern und Papieren kuratiert werden. Diese organischen Daten sind zwar nützlich, enthält jedoch häufig Inkonsistenzen, irrelevante Informationen oder einen Mangel an strukturierten Herausforderungen, die die Argumentationsfähigkeiten des Modells vorantreiben. Hier kommt synthetische Daten ins Spiel.

Rolle synthetischer Daten in PHI-4

Das Team generiert künstlich synthetische Daten, um bestimmte Trainingsziele zu erreichen, was es zu einem hochwirksamen Instrument zur Leitung des Lernprozesses des Modells macht. Für PHI-4 können synthetische Daten qualitativ hochwertige Datensätze erstellen, die ein starkes Denken und die Fähigkeiten zur Problemlösung fördern.

Strukturiertes Lernen: Im Gegensatz zu organischen Daten, die häufig Modelle benötigen, um komplexe, indirekte Beziehungen zwischen Token zu entschlüsseln, ermöglichen synthetische Daten das systematische Erlernen von PHI-4. Beispielsweise liefern die synthetischen Daten bei Mathematik- oder Codierungsaufgaben ein klares Argumentieren, so dass das Modell logische Fortschritte befolgt.
Vielfalt der Herausforderungen: Synthetische Daten können generiert werden, um eine breite Palette von Themen und Fähigkeiten abzudecken, um sicherzustellen, dass das Modell auf verschiedene Herausforderungen stößt. Beispielsweise umfassen die synthetischen Datensätze von PHI-4 komplexe mathematische Probleme, kodierende Herausforderungen und wissenschaftliche Argumentationsaufgaben-die so konzipiert wurde, dass sie die kognitiven Fähigkeiten des Modells ausdehnen.
Ausrichtung mit Inferenzkontexten: Ein Schlüsselvorteil von synthetischen Daten besteht darin, dass sie in Formaten generiert werden können, die eng mit den Arten von Ausgängen übereinstimmen, von denen das Modell während realer Wechselwirkungen erzeugt wird. Dies hilft PHI-4, Antworten zu generieren, die kontextuell geeignet sind und an Benutzeranfragen besser ausgerichtet sind.

Synthetische Datentechniken in PHI-4

Die synthetischen Daten von PHI-4 werden nicht nur zufällig generiert, sondern wird sorgfältig mit einer Kombination fortschrittlicher Techniken hergestellt:

Multi-Agent-Aufforderung: Mehrere Agenten (Modelle) erzeugen unterschiedliche Lösungen für dasselbe Problem, die dann für Qualität und Konsistenz filtriert werden. Dies erzeugt verschiedene und nuancierte Beispiele, die die Fähigkeiten zur Problemlösung des Modells in Frage stellen.
Self-Revisions-Workflows: Das Modell generiert zunächst Antworten und kritisiert und verfeinert sie dann durch iterative Rückkopplungsschleifen. Dies hilft, die Genauigkeit und das Denken der generierten Antworten zu verbessern.
Umkehrung der Anweisung: Für die Codierung von Aufgaben verwendet PHI-4 Anweisungsumkehrtechniken. Es verwandelt vorhandene Code -Snippets in Problembeschreibungen und hilft dem Modell, Lösungen effektiv zu generieren.

Durch die Priorisierung solcher Techniken lernt PHI-4, Probleme intelligenter zu lösen und gleichzeitig Vorurteile zu reduzieren, die sich aus rein organischen Datensätzen ergeben können.

Wie wurde Phi-4 ausgebildet?

Die beeindruckende Leistung von PHI-4 ergibt sich nicht ausschließlich aus der Verwendung synthetischer Daten. Der Trainingscurriculum des Modells ist auch für seinen Erfolg von entscheidender Bedeutung. Die Hersteller von PHI-4 haben einen hoch entwickelten Trainingsprozess entwickelt, der eine ausgewogene Mischung von Datentypen umfasst, einschließlich organischer Quellen und synthetischer Daten.

Vorbereitung mit einer Mischung von Datenquellen

Das PHI-4-Modell verwendet eine Nur-Decoder-Transformatorarchitektur mit 14 Milliarden Parametern und arbeitet zunächst mit einer Kontextlänge von 4096 Token. Diese Kontextlänge wird später während einer nachfolgenden Midtraining -Phase auf 16K -Token erhöht. Die Architektur hat viele Ähnlichkeiten mit dem PHI-3-MEDIUM-Modell, führt jedoch mehrere Verbesserungen ein. Bemerkenswerterweise nimmt PHI-4 den tiktoken-Tokenizer an, der die mehrsprachige Unterstützung verbessert und eine Vokabulargröße von 100.352 Token, einschließlich unbenutzter Token, hat. Darüber hinaus weckt PHI-4 die gesamte 4K-Kontextlänge in voller Aufmerksamkeit, eine Abweichung vom 2K-Ansatz für Schiebungsfenster, die im PHI-3-Medium verwendet werden.

Das Team hatte das Modell mit ungefähr 10 Billionen Token nach einem linearen Aufwärm- und Zerfallsplan. Sie setzen die Spitzenlernrate auf 0,0003, wendeten einen konstanten Gewichtsverfall von 0,1 an und verwendeten eine globale Chargengröße von 5760. Sie wurden durch die Interpolation von kürzeren Läufen und Spannungstests der Lernrate-Aufwärmphase eingestimmt, um die Modellstabilität zu gewährleisten. Nach der Vorbereitung wurde das Modell einer kurzen Midtraining -Stufe unterzogen, um die ursprüngliche 4K -Kontextlänge auf 16K -Token zu erweitern.

Da vorgebrachte Modelle in der Regel bei den Anweisungsaufgaben nicht gut abschneiden, haben sich die Forscher dafür entschieden, sich nicht auf 0-Shot-Bewertungen wie einfache Evals zu verlassen, die Antworten in einem bestimmten Format erfordern. Stattdessen entwickelten sie einen benutzerdefinierten Bewertungsansatz für die Vorabbildung, die Log-Likelihood-Bewertungen und wenige Aufforderungen für verschiedene Aufgaben kombiniert. Zum Beispiel verwendete das Team Log-Likelihood-Bewertungen für Aufgaben wie MMLU (5-Shot), MMLU-PRO und ARCC (1-Shot). Darüber hinaus trainierten sie das Modell unter Verwendung von Beispielen für Aufgaben wie Triviaqa (TQA), MBPP, Math und GSM8K unter Verwendung von Beispielen für Aufgaben wie Triviaqa, 4, 4 und 8, die dazu beitragen, den erforderlichen Antwortformaten zu folgen und korrekte Lösungen zu extrahieren.

Erkenntnisse aus der Phase der Mitte der Schulung

In der Midtraining-Phase von PHI-4 wird die Kontextlänge von den ursprünglichen 4K-Token auf 16K-Token erweitert. In dieser Phase führen die Forscher eine Reihe von Ablationsstudien durch, um zu untersuchen, wie sich unterschiedliche Arten von Daten auf die Leistung des Modells mit langen Kontexten auswirken. Sie vergleichen Datenquellen, die natürlich längere Kontexte mit synthetischen Daten haben, bei denen kürzere Sequenzen gepolstert sind, um längere zu erstellen. Die Ergebnisse zeigen, dass das Modell bei Daten, die von Natur aus lange Kontexte haben, besser abschneidet.

Das Team verfeinert seinen Datensatz, indem sie qualitativ hochwertige, nicht synthetische Daten wie akademische Arbeiten, Bücher und Code herausgefiltert. Sie isolieren Proben länger als 8K -Token und geben diesen 16 -km -Token oder länger mehr Gewicht. Neue synthetische Datensätze werden mit Sequenzen erstellt, die länger als 4K -Token sind. Die endgültige Datensatzmischung enthält 30% lange Kontextdaten und 70% zurückgerufene Token aus der Vorbereitung. Um die erhöhte Kontextlänge zu berücksichtigen, setzt das Team die Basisfrequenz der Rotary Position Coding (Seil) auf 250K. Sie reduzieren die maximale Lernrate um den Faktor 10 und schulen das Modell mit 250 Milliarden Token.

Um die Fähigkeit von PHI-4 zu bewerten, lange Kontexte zu bewältigen, betonen die Forscher eine Vielzahl realer Aufgaben, anstatt sich ausschließlich auf synthetische Benchmarks wie Nadel-in-a-Haystack oder Herrscher zu verlassen, die praktische Szenarien einfacher, aber weniger widerspiegeln. Das Team wählt diese Aufgaben aus der Bewertungssuite des Helms [YGH 24] aus und durchschnittlich die Ergebnisse in fünf Läufen für jede Kategorie.

Bewertungsrahmen

Der Bewertungsrahmen enthält die folgenden Aufgaben:

Rückruf: Das Modell ruft einen bestimmten Wert aus einer zufällig generierten Long JSON -Datei basierend auf einem bestimmten Schlüssel ab, gemessen mit der Subem -Metrik.
RAG (Retrieval-Augmented-Generation): Das Modell beantwortet Fragen basierend auf mehreren abgerufenen und gemischten Wikipedia-Dokumenten mit Datensätzen wie NaturalQuestions, Hotpotqa und Popqa. Die endgültigen Ergebnisse werden über alle Datensätze gemittelt und mit der Subem -Metrik bewertet.
Wiederholung: In dieser Aufgabe wird das Modell die Top-10-Dokumente, die für eine bestimmte Abfrage mit dem MSMARCO-Datensatz für eine bestimmte Abfrage abgerufen wurden, erneut abgerufen. Die Leistung wird mit NDCG@10 gemessen.
ICL (In-Context Learning): Diese Task testet die Fähigkeit des Modells, viele Schuss-In-Kontext-Lernen auf Datensätzen wie TREC Grob, TREC Fine, Banking77, NLU und Clinc150 durchzuführen. Die Ergebnisse werden über alle Datensätze gemittelt, wobei die Leistung an der F1 -Punktzahl gemessen wird.
QA (Fragenbeantwortung): Das Modell beantwortet Fragen basierend auf langen Dokumenten aus dem Datensatz von narrativeQav2, wobei die Leistung unter Verwendung von GPT-4O-Bewertung ausgewertet wird.
SUMP (Zusammenfassung): Die Aufgabe umfasst die Zusammenfassung langer Rechtsdokumente aus dem Multi-LEXSUM-Datensatz, wobei die Ergebnisse mithilfe von GPT-4O-Bewertung ausgewertet werden.

Diese umfassende Bewertungsstrategie testet die lang Kontextfähigkeiten von PHI-4 in verschiedenen praktischen Aufgaben gründlich. Es spiegelt die reale Anwendbarkeit des Modells wider.

Ergebnisse und Überlegungen aus dem Training nach dem Training

Nach dem Training zielt darauf ab, das vorgezogene Sprachmodell in einen KI-Assistenten umzuwandeln, den Benutzer können
sicher interagieren mit. Phi-4 richten das vorgezogene Modell mit einer Runde SFT aus, einer Runde DPOON-Daten aus unserer entscheidenden Token-Suchmethode und einer Runde DPO auf Präferenzpaare in voller Länge. Das Modell unterzogen sich mit dem Standard-ChatML-Format feinstumsam. Eine Beispiel -Verwendungsvorlage für zwei Gesprächsrunden ist wie folgt:

PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren

Innovative Nach-Training-Techniken

Sobald die Vorbereitung abgeschlossen ist, tritt pHi-4 in eine Phase nach der Ausbildung ein, in der eine weitere Feinabstimmung stattfindet. Diese Phase konzentriert sich auf die Verfeinerung der Argumentationsfähigkeiten des Modells und die Verbesserung der Qualität seiner Ergebnisse. Mehrere Innovationen nach dem Training tragen zur beeindruckenden Leistung von PHI-4 bei:

Überlebte Feinabstimmung: Inthse, Forscher-Tune-Tune des vorbereiteten Modells mit einer Lernrate von 10–6onavarietiefdatagener aus hochwertigen Daten in verschiedenen Domänen, einschließlich Mathematik, Codierung, Argumentation, Konversation, Modellidentität und Sicherheit fügten auch mehrsprachige Daten für 40 Sprachen hinzu.
Direkte Präferenzoptimierung: Forscher verwenden DPO, um das Modell mit den menschlichen Präferenzen auszurichten und das Modell auch durch Paare gewünschter und unerwünschter Ausgaben vom unerwünschten Verhalten abzulenken. DPO -Daten deckt die Daten zur Chat -Format, Argumentation und verantwortungsbewusste KI (RAI) -Daten ab und verbessert das Modell in Mathematik, Codierung, Argumentation, Robustheit und Sicherheit. Sie haben zwei Runden DPO auf dem SFT -Modell gemacht.
Pivotal Token Search (PTS): Eine neuartige Technik, die für PHI-4 entwickelt wurde, identifiziert PTS wichtige Token in einer Antwort, die einen signifikanten Einfluss auf den Gesamterfolg der Ausgabe des Modells hat. Dies ermöglicht es dem Modell, sich auf die Verbesserung spezifischer, kritischer Token in seinen Antworten zu konzentrieren und eine größere Genauigkeit und Robustheit zu gewährleisten.

PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren

Leistung bei wichtigen Benchmarks

Um die Fähigkeiten von PHI-4 zu bewerten, ist es wichtig, seine Leistung auf Standard-Benchmarks zu untersuchen. PHI-4 übertrifft seine Vorgänger und viele größere Modelle in mehreren kritischen Aufgaben konsequent.

PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren

Stiel- und Argumentationsaufgaben

PHI-4 glänzt insbesondere in der Beantwortung von Fragen zur Beantwortung von Fragen (wie GPQA für Absolventen) und Mathematikwettbewerben (Mathematik). Obwohl er kleiner als Modelle wie LLAMA-3 ist, erzielt er vergleichbare oder überlegene Ergebnisse bei diesen argumentationsstörenden Aufgaben. Dies ist ein Beweis für die effektive Verwendung synthetischer Daten durch das Modell und deren Fokus auf strukturierte, logische Problemlösung.

Zum Beispiel übertrifft PHI-4 das Lehrermodell GPT-4 bei vielen Argumentationsbenchmarks wie GPQA und Mathematik, obwohl sie ein kleineres Modell sind. Die Einbeziehung hochwertiger synthetischer Daten und innovativer Trainingstechniken hat es PHI-4 ermöglicht, die Fähigkeiten viel größerer Modelle in diesen Bereichen zu übertreffen.

Codierung und technische Aufgaben

Bei Codierungsaufgaben übertrifft PHI-4 auch Modelle wie GPT-4 Mini und Qwen 2.5. Unabhängig davon, ob es sich um algorithmische Probleme bei Humaneroden oder in komplexeren Programmierherausforderungen handelt, die Fähigkeit von PHI-4, Logik effektiv zu argumentieren und anzuwenden, macht es zu einem der Top-Performer im Kodierungsraum.

Sicherheit

PHI-4 zeigt robuste Schutzmaßnahmen gegen die Erzeugung schädlicher oder voreingenommener Inhalte, um ethische und verantwortungsbewusste KI-Wechselwirkungen beim Benchmarking sicherzustellen.

PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren

Wie man phi-4 lokal ausführt

Durch die lokale Ausführung von PHI-4 können Sie direkt von Ihrem System mit diesem erweiterten KI-Modell interagieren und Komfort und Flexibilität für das Testen oder die Anwendungsentwicklung bieten. Befolgen Sie die folgenden Schritte, um es einzurichten:

Installieren Sie Ollama

Ollama ist ein Werkzeug, das das Laufen und Interaktion mit KI-Modellen wie Phi-4 ermöglicht. Beginnen Sie mit der Installation von Ollama in Ihrem System. Auf der offiziellen Website von Ollama finden Sie detaillierte Installationsanweisungen.

Führen Sie Phi-4 in der Befehlszeile aus

Sobald Ollama installiert ist, können Sie das PHI-4-Modell mit einem einzigen Befehl in Ihrem Terminal oder PowerShell ausführen:

 Ollama Run Vanilj/Phi-4

Nach dem Login kopieren

Dieser Befehl initialisiert das PHI-4-Modell und ermöglicht es Ihnen, direkt in Ihrer CLI mit ihm zu interagieren. Sie können sofort anfangen zu chatten oder Fragen zu stellen.

Integrieren Sie PHI-4 in Langchain

Für fortgeschrittenere Anwendungsfälle wie die Integration von PHI-4 in einen Workflow oder eine Anwendung können Sie Langchain mit Ollama verwenden. Langchain bietet Tools für die programmgesteuerte Arbeit mit Sprachmodellen.

Installieren Sie die Langchain-Ollama-Bibliothek:

 %PIP Installation -U Langchain -Ollama

Nach dem Login kopieren

Verwenden Sie das folgende Python-Skript, um PHI-4 über Langchain auszuführen:

 von Langchain_core.prompts importieren Sie ChatpromptTemplate
von Langchain_ollama.llms import oolamallm
template = "" "Frage: {Frage}
Antwort: Denken wir Schritt für Schritt nach. "" "
fordert = chatpromptTemplate.from_template (Vorlage)
Modell = ollamallm (Modell = "Vanilj/Phi-4")
Kette = Eingabeaufforderung | Modell
print (chain.invoke ({"Frage": "Schreiben Sie ein Gedicht über AI?"}))

Nach dem Login kopieren

PHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren

Herausforderungen: Umgang mit Überanpassung und Datenkontamination

Kein Modell ist perfekt und PHI-4 hat seine eigenen Herausforderungen. Überanpassung ist ein häufiges Problem bei der KI -Entwicklung. Es kommt vor, wenn ein Modell auf Trainingsdaten zu speziell wird und die Verallgemeinerung verletzt. PHI-4 befasst sich mit einem Datendekontaminationsprozess. Dies stellt sicher, dass keine Testdaten in das Training enthalten sind, was das Überanpassungsrisiko verringert.

Überanpassungsminderung

Durch die Verwendung von frischen Datensätzen wie den Mathematikwettbewerben von AMC-10 und AMC-12 November 2024 hat er gezeigt, dass er weit über seine Trainingsempfänger hinaus verallgemeinert und hervorragend bei neuen Aufgaben ausgeführt wird. Dies ist entscheidend dafür, dass PHI-4 ein robustes und zuverlässiges Werkzeug für reale Anwendungen bleibt.

Schwächen

Anweisungen folgt: Während Phi-4 bei den Argumentationsaufgaben gut abschneidet, kämpft er mit strengen Anweisungen. Aufgaben, die spezifische Formatierung oder komplexe stilistische Anweisungen erfordern, können manchmal dazu führen, dass das Modell den Kurs abhebt.
Tatsachen Halluzinationen: PHI-4 hat in einigen Fällen immer noch mit der sachlichen Genauigkeit zu kämpfen, insbesondere bei der Erstellung von Informationen über nicht existierende oder hypothetische Personen.

Abschluss

PHI-4 ist ein Game-Changer in der Welt der Sprachmodelle. Die Kombination aus innovativen synthetischen Datengenerierung, modernsten Trainingstechniken und Verfeinerungen nach dem Training unterscheidet sie von vielen anderen Modellen. PHI-4 zeigt, dass Qualität mit dem richtigen Ansatz für das Training Quantität übertrumpft-überlegene Leistung bei der Argumentation von Aufgaben, MINT-Q & A und Codierungsherausforderungen, obwohl sie kleiner sind als viele zeitgenössische Modelle.

PHI-4 ist nicht ohne Herausforderungen, insbesondere in Bezug auf Unterricht und sachliche Genauigkeit. Die bemerkenswerten Fähigkeiten im logischen Denken und die Problemlösung machen es jedoch zu einem erheblichen Schritt nach vorne im KI-Raum. Während sich die KI weiterentwickelt, setzt die Verwendung von synthetischen Daten durch den PHI-4 ein Modell für zukünftige Entwicklungen im Bereich. Es hilft, die Grenzen dessen zu überschreiten, was mit Sprachmodellen möglich ist.

Key Takeaways

PHI-4 nutzt synthetische Daten, um die Qualität vor der Quantität zu priorisieren und seine Argumentation, die Beantwortung von MINT-Fragen und die Codierungsfunktionen zu verbessern.
Synthetische Daten in PHI-4 führen strukturiertes Lernen, unterschiedliche Herausforderungen und eine bessere Ausrichtung mit realen Inferenzkontexten ein.
Das Training von PHI-4 umfasst die Vorbeugung, die Midtraining mit erweiterten Kontextlängen und innovative Nach-Training-Techniken für die Feinabstimmung.
MidTraining erweitert die Kontextlänge von PHI-4 von 4K auf 16K-Token und optimiert ihn für langkontextbezogene Aufgaben.
Die Bewertung von PHI-4 betont reale Aufgaben wie Lappen, Zusammenfassung und das Lernen des Kontextes für praktische Erkenntnisse.
Nach der Ausbildung innovationen, einschließlich beaufsichtigter Feinabstimmung und direkter Präferenzoptimierung, verfeinern die Argumentation und Sicherheit von PHI-4.
Die Architektur von PHI-4 in Verbindung mit fortschrittlichen Datensätzen und Trainingstechniken setzt einen neuen Benchmark in NLP für die Umgang mit komplexen Problemlösungsaufgaben fest.

Häufig gestellte Fragen

Q1. Was ist Phi-4 und wie unterscheidet es sich von früheren Modellen?

A. PHI-4 ist ein großflächiges KI-Modell, das auf einer Decoder-Transformatorarchitektur basiert. PHI-4 baut auf Modellen wie PHI-3-Medium auf, indem die Kontextlänge auf 16K-Token erhöht wird. Außerdem werden verbesserte Datenvorverarbeitungstechniken, einschließlich Tiktoken, für eine bessere mehrsprachige Unterstützung eingeführt.

Q2. Warum sind synthetische Daten für das Training von PHI-4 wichtig?

A. Synthetische Daten spielen eine Schlüsselrolle beim Training von PHI-4, da das Modell die langen Kontextaufgaben effektiver erledigt. Durch die Kombination realer Daten mit synthetisch generierten Sequenzen verallgemeinert Phi-4 besser in verschiedenen Szenarien. Dies verbessert seine Leistung bei Aufgaben, die Argumentation in großen Datensätzen erfordern.

Q3. Was sind die wichtigsten Phasen des Trainingsprozesses von PHI-4?

A. Das Training von PHI-4 beinhaltet drei Phasen. Die Vorbereitung verwendet verschiedene Datenquellen. MidTraining erweitert die Kontextlänge von 4K auf 16K -Token. Nach der Ablagerung umfasst Feinabstimmentechniken wie SFT, Verstärkungslernen mit DPO und Token-Probenahme (PTS) aus der Vorabstufe.

Q4. Wie tritt PHI-4 bei realen Aufgaben auf?

A. PHI-4 zeichnet sich in einer Vielzahl realer Benchmarks aus, einschließlich Fragen zur Beantwortung von Fragen, Zusammenfassen und der Generation von Abrufen. PHI-4 zeichnet sich in den Argumentation von Aufgaben über lange Dokumente aus und bewertet mit verschiedenen Datensätzen aus der Helm-Evaluierungssuite.

Die in diesem Artikel gezeigten Medien sind nicht im Besitz von Analytics Vidhya und werden nach Ermessen des Autors verwendet.

Das obige ist der detaillierte Inhalt vonPHI-4: Neudefinition von Sprachmodellen mit synthetischen Daten neu definieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!