如何提高文本分类的 ML 模型准确性?
各位专家,您好,
我们正在处理文本分类问题。我们有大约 80K 条记录,大约有 50 个类。数据极不平衡。它有 2 列,一列用于描述,另一列包含类。
到目前为止,我们已经尝试了以下模型和技术:
- 数据预处理: 一个。小写转换,删除数字文本,删除 标点符号 b.删除了不重要的单词和停用词 c.词形还原
- TFIDF 转换
- 使用 SKLEARN 模型: 一个。线性SVC b.线性回归 c.逻辑回归 d.决策树 e.随机森林
- 使用 Huggingface 变形金刚: 一个。谷歌伯特 b.蒸馏伯特
- SMOTE 采样
据观察,我们获得的最大准确度为 70%(随机森林和 Google Bert)。
准确性还有提升空间吗?
如果是,我们还可以使用哪些其他技术或模型来提高准确性?
以上是如何提高文本分类的 ML 模型准确性?的详细内容。更多信息请关注PHP中文网其他相关文章!
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章
Windows 11 KB5054979中的新功能以及如何解决更新问题
4 周前
By DDD
如何修复KB5055523无法在Windows 11中安装?
3 周前
By DDD
Inzoi:如何申请学校和大学
1 个月前
By DDD
如何修复KB5055518无法在Windows 10中安装?
3 周前
By DDD
在哪里可以找到Atomfall中的站点办公室钥匙
4 周前
By DDD

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

使用FiddlerEverywhere进行中间人读取时如何避免被检测到当你使用FiddlerEverywhere...

如何在10小时内教计算机小白编程基础?如果你只有10个小时来教计算机小白一些编程知识,你会选择教些什么�...

攻克Investing.com的反爬虫策略许多人尝试爬取Investing.com(https://cn.investing.com/news/latest-news)的新闻数据时,常常�...

Python3.6环境下加载pickle文件报错:ModuleNotFoundError:Nomodulenamed...

使用Scapy爬虫时管道文件无法写入的原因探讨在学习和使用Scapy爬虫进行数据持久化存储时,可能会遇到管道文�...
