社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > ChatGPT标注数据比人类便宜20倍，80%任务上占优势

ChatGPT标注数据比人类便宜20倍，80%任务上占优势

王林

发布： 2023-04-04 14:40:05

转载

1232 人浏览过

简单来讲，数据标注就是给社交媒体上的内容数据贴标签，将其以不同主题或者概念进行分类，或是对其立场以及情绪进行判别。这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

又一“人类饭碗”被AI抢走，还是和训练AI息息相关的：

数据标注。

苏黎世大学研究发现，在ChatGPT面前，无论成本还是效率，人类可以说是毫无优势：

成本上，ChatGPT平均每个标注成本低于0.003美元，比众包平台便宜20倍；
效率上，在相关性、立场、主题等任务中，ChatGPT也是以4:1的优势“碾压”人类。

论文发出后，有网友调侃，“生成训练数据需要人工”的说法已经成为过去式了。

还有人直呼“古籍修复数字化工作是不是有希望提速了”。

还有人看热闹不嫌事大，直接发推称：

这是直接端了平台工作者的饭碗。

话说回来，ChatGPT是怎么抢了数据标注工作者的“饭碗”的？

ChatGPT在80%任务上占优势

首先得先了解下数据标注工作的具体内容。

简单来讲，数据标注就是给社交媒体上的内容数据贴标签，将其以不同主题或者概念进行分类，或是对其立场以及情绪进行判别。

这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

以往，这类工作都是交由人工处理的，比如说MTurk就是专门进行数据标注的一个众包平台。

在MTurk这类众包平台内部，还会有更加精细的分工，比如说会有经过专业训练的数据标注者以及众包工作者。

前者在产出高质量数据上具有优势，但自然成本也更高，而后者虽然更便宜但质量也会随任务难度波动。

于是研究团队就开始着手研究大语言模型（LLM）在这方面的潜力，并且对比了没有额外训练（zero-shot）的ChatGPT（基于GPT-3.5）和MTurk在数据标注上的性能。

这项对比基于研究团队此前收集到的2382条推文样本。

ChatGPT和MTurk分别将推文以“相关性、立场、主题、政策、实用性”这五种任务进行标注。

评估的标准有两条：

准确性：ChatGPT和MTurk众包工作者相较于正确标注的百分比；
编码者间的一致性信度：用ChatGPT、MTurk众包工作者以及专业数据标注者任意二者之间的一致性来计算；

结果呢也显而易见，在准确性上，ChatGPT有五分之四的任务都要优于MTurk众包工作者。

在一致性信度上，ChatGPT全部任务都超过了专业数据标注者。

成本方面，开头也已经提过，ChatGPT平均每条比人工便宜20倍，何况AI还能24*7无休。

不过对于研究团队得出的这个结论并不是所有网友都买账，有人表示：

这五条任务都太单一了，难度也是。仅凭这一点就得出这样的结论可靠性存疑。

甚至还有网友嘲讽了起研究样本太少来：

（竟然）只用2382条推文做样本。

“饭碗威胁”不止数据标注

现在，AI会不会完全取代某一类工作还不好说，但它会在一定程度上影响人类工作是毋庸置疑的。

上周，OpenAI就发布过一份分析报告，称有80%的工作都会在一定程度上受到ChatGPT的影响，19%的岗位会受到ChatGPT的严重冲击。

并且薪资越高的职业受到的冲击就越大。

OpenAI还进一步列出了会被影响的具体职业，从大到小依次是：

翻译从业者、文字创作者（包括诗人、作家等）、公关人员、数学家、税务编制人员、区块链工程师、财务工作者、媒体从业者……

△图源：OpenAI

除此之外，OpenAI的CEO奥特曼也不止在一个场合下说过“AI会取代现有的部分工作”。

前不久，MidjourneyV5大升级也是让不少人类画师直呼饭碗不保。

emmmmmm，你觉得你的饭碗还保得住吗？

论文地址：https://arxiv.org/abs/2303.15056
参考链接：https://twitter.com/arankomatsuzaki/status/1640521970608402435

以上是ChatGPT标注数据比人类便宜20倍，80%任务上占优势的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

chatgpt 数据标注

上一篇：聊天机器人也要赚钱：微软必应聊天在回复中加入广告下一篇：中国AIGC产业峰会今日举行：微软百度科大讯飞解答ChatGPT商业化，两大圆桌论坛剑指AIGC新机遇

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

公众号网页更新缓存难题：如何避免版本更新后旧缓存影响用户体验？

2025-03-04 13:24:15
叉子

2025-02-28 14:39:11
培训大语言模型：从TRPO到GRPO

2025-02-26 04:41:08
托管开源LLM的经济学

2025-02-26 03:15:10
当机器提前思考时：战略AI的兴起

2025-02-26 03:06:12
了解chatgpt的演变：第3部分 - Codex和Consendgpt的见解

2025-02-26 02:58:10
LLM中具有稀疏自动编码器的特征电路的配方

2025-02-26 01:46:08
封闭式学习背后的数学

2025-02-26 00:03:10
从简历到求职信，使用AI和LLM，带有Python和简化

2025-02-25 23:59:12
我们需要的一切吗？

2025-02-25 19:49:12

最新问题

使用Smolagents为AI代理构建自定义工具

2025-03-21 11:17:10
使用Paligemma 2混合建造医疗处方扫描仪

2025-03-21 11:16:16
如何将Mistral OCR用于下一个抹布模型

2025-03-21 11:11:10
14个流行的LLM基准在2025年知道

2025-03-21 11:08:12
大型概念模型的兴起：AI＆＃039; sext Evolutionary Step-分析Vidhya

2025-03-21 11:05:16

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1438777
php入门教程之一周学会PHP

4299826
JAVA 初级入门视频教程

2677692
小甲鱼零基础入门学习Python视频教程

517716
PHP 零基础入门教程

878973

最新下载

更多>

网站特效

网站源码

网站素材

前端模板