社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

王林

发布： 2023-04-29 11:25:06

转载

1967 人浏览过

ChatGPT的出现，让不少人看到了交期末大作业的曙光（手动狗头）。

无论是英语论文、还是阅读笔记，只要在ChatGPT的知识范围内，都可以拜托它帮忙完成，写出来的内容也有理有据。

不过，有没有想过你的老师也准备用“AI文本检测器”一类的东西来防止你作弊？

像这样输入一段看起来没毛病的笔记，经过它一番检测，认为这段文字“由AI编写”（Fake）的可能性为99.98%！

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

△文本由ChatGPT生成

换个数学论文试试？ChatGPT的输出看起来没啥问题，却仍然被它准确识破了：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

△文本由ChatGPT生成

这可不是靠瞎蒙或猜测，毕竟对方同样是个AI，还是个训练有素的AI。

看到这有网友调侃：用魔法打败魔法？

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

用AI写的东西来训练新AI

这个AI检测器名叫GPT-2 Output Detector，是OpenAI联合哈佛大学等高校和机构一起打造的。（没错，OpenAI自家做的）

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

输入50个以上字符（tokens）就能较准确地识别AI生成的文本。

但即便是专门检测GPT-2的模型，用来检测其他AI生成文本效果也同样不错。

作者们先是发布了一个“GPT-2生成内容”和WebText（专门从国外贴吧Reddit上扒下来的）数据集，让AI理解“AI语言”和“人话”之间的差异。

随后，用这个数据集对RoBERTa模型进行微调，就得到了这个AI检测器。

RoBERTa（Robustly Optimized BERT approach）是BERT的改进版。原始的BERT使用了13GB大小的数据集，但RoBERTa使用了包含6300万条英文新闻的160GB数据集。

其中，人话一律被识别为True，AI生成的内容则一律被识别为Fake。

例如这是一段从Medium英文博客上复制的内容。从识别结果来看，很显然作者是亲自写的（手动狗头）：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

△文字来源Medium@Megan Ng

当然，这个检测器也并非100%准确。

AI模型参数量越大，生成的内容越不容易被识别，例如1.24亿参数量的模型“被抓包”的概率就比15亿参数更高。

同时，模型生成结果随机性越高，AI生成内容被检测出来的概率也会更低。

但即便将模型调整到生成随机性最高（Temperature=1，越接近0生成随机性越低），1.24亿参数模型被检测出的概率仍然是88%，15亿参数模型被检测出的概率仍然有74%。

这是OpenAI两年前发布的模型，当时对GPT-2生成的内容就“一打一个准”。

现在面对升级版的ChatGPT，检测英文生成内容的效果依旧能打。

但面对ChatGPT生成的中文，它的识别能力就不那么好了。例如让ChatGPT来一段作文：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

AI检测器给出是人写的概率为99.96%……

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

当然话说回来，ChatGPT也能检测自己生成的文本。

所以，不排除老师将你的作业直接交给ChatGPT来识别：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

One More Thing

值得一提的是，ChatGPT表示自己并不能访问互联网来搜索信息。

显然，它还意识不到GPT-2 Output Detector这个AI检测器的存在：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

所以能不能像网友所说，让ChatGPT生成一段“不被AI检测器测出来的”内容呢？

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

很遗憾不能：

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

所以大作业还是自己写吧……

参考链接：[1]https://weibo.com/1402400261/Mj7QtwRoH[2]https://github.com/openai/gpt-2-output-dataset/tree/master/detector[3]https://chat.openai.com/

[4]https://medium.com/user-experience-design-1/how-chatgpt-is-blowing-google-out-of-the-water-a-ux-breakdown-784340c25d57

以上是ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

ai chatgpt 笔记

上一篇：谷歌研究员炮轰GPT初创公司瞎炒作，连发18条推文怒怼！下一篇：AI开发大一统：谷歌OpenXLA开源，整合所有框架和AI芯片

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

公众号网页更新缓存难题：如何避免版本更新后旧缓存影响用户体验？

2025-03-04 13:24:15
叉子

2025-02-28 14:39:11
培训大语言模型：从TRPO到GRPO

2025-02-26 04:41:08
托管开源LLM的经济学

2025-02-26 03:15:10
当机器提前思考时：战略AI的兴起

2025-02-26 03:06:12
了解chatgpt的演变：第3部分 - Codex和Consendgpt的见解

2025-02-26 02:58:10
LLM中具有稀疏自动编码器的特征电路的配方

2025-02-26 01:46:08
封闭式学习背后的数学

2025-02-26 00:03:10
从简历到求职信，使用AI和LLM，带有Python和简化

2025-02-25 23:59:12
我们需要的一切吗？

2025-02-25 19:49:12

最新问题

让 WordPress 插件在特定事件后工作（例如，当创建草稿帖子时）

来自于 1970-01-01 08:00:00

0

0

0

使用React Native Expo将多个图像上传到Firebase集合和Firebase

来自于 1970-01-01 08:00:00

0

0

0

objective-c - presentViewController后,dismiss回来高度偏差

来自于 1970-01-01 08:00:00

0

0

0

把gitlab中的测试项目，添加到jenkins发生认证错误

来自于 1970-01-01 08:00:00

0

0

0

objective-c - 做post请求时，服务端可以检测到接收到两个非空的字段，但是返回了错误

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1437640
php入门教程之一周学会PHP

4297795
JAVA 初级入门视频教程

2668466
小甲鱼零基础入门学习Python视频教程

516913
PHP 零基础入门教程

877811

最新下载

更多>

网站特效

网站源码

网站素材

前端模板