如何提高文本分类的 ML 模型准确性?

WBOY
发布: 2024-08-06 20:16:30
原创
949 人浏览过

How to improve ML Model Accuracy for Text Classification?

各位专家,您好,

我们正在处理文本分类问题。我们有大约 80K 条记录,大约有 50 个类。数据极不平衡。它有 2 列,一列用于描述,另一列包含类。
到目前为止,我们已经尝试了以下模型和技术:

  1. 数据预处理: 一个。小写转换,删除数字文本,删除 标点符号 b.删除了不重要的单词和停用词 c.词形还原
  2. TFIDF 转换
  3. 使用 SKLEARN 模型: 一个。线性SVC b.线性回归 c.逻辑回归 d.决策树 e.随机森林
  4. 使用 Huggingface 变形金刚: 一个。谷歌伯特 b.蒸馏伯特
  5. SMOTE 采样

据观察,我们获得的最大准确度为 70%(随机森林和 Google Bert)。
准确性还有提升空间吗?
如果是,我们还可以使用哪些其他技术或模型来提高准确性?

以上是如何提高文本分类的 ML 模型准确性?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!