Hallo Experten,
Wir beschäftigen uns mit dem Problem der Textklassifizierung. Wir haben rund 80.000 Datensätze mit rund 50 Klassen. Die Datenlage ist stark unausgewogen. Es hat 2 Spalten, eine für die Beschreibung und die andere enthält die Klasse.
Bisher haben wir folgende Modelle und Techniken ausprobiert:
Es wird beobachtet, dass die maximale Genauigkeit, die wir erreicht haben, 70 % beträgt (Random Forest und Google Bert).
Gibt es Möglichkeiten zur Verbesserung der Genauigkeit?
Wenn ja, welche anderen Techniken oder Modelle können wir verwenden, um die Genauigkeit zu verbessern?
Das obige ist der detaillierte Inhalt vonWie kann die Genauigkeit des ML-Modells für die Textklassifizierung verbessert werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!