Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?

WBOY
Lepaskan: 2024-08-06 20:16:30
asal
1110 orang telah melayarinya

How to improve ML Model Accuracy for Text Classification?

Hai Pakar,

Kami sedang menangani Masalah Klasifikasi Teks. Kami mempunyai kira-kira 80K rekod dengan kira-kira 50 kelas. Data sangat tidak seimbang. Ia mempunyai 2 lajur satu untuk penerangan dan satu lagi mengandungi kelas.
Sehingga kini kami telah mencuba model dan teknik berikut:

  1. Prapemprosesan Data: a. Penukaran huruf kecil, teks berangka yang dialih keluar, dialih keluar tanda baca b. Mengalih keluar perkataan yang tidak penting dan menghentikan perkataan c. Lemmatisasi
  2. Transformasi TFIDF
  3. Menggunakan Model SKLEARN: a. SVC linear b. Regresi Linear c. Regresi Logistik d. Pokok Keputusan e. Hutan Rawak
  4. Menggunakan Huggingface Transformers: a. Google Bert b. Suling Bert
  5. Persampelan SMOTE

Adalah diperhatikan bahawa ketepatan maksimum yang kami dapat ialah 70% (Random Forest dan Google Bert).
Adakah terdapat sebarang skop untuk meningkatkan ketepatan?
Jika ya, apakah teknik atau model lain yang boleh kami gunakan untuk meningkatkan ketepatan?

Atas ialah kandungan terperinci Bagaimana untuk meningkatkan Ketepatan Model ML untuk Pengelasan Teks?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan