识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了-人工智能-PHP中文网

引言

算法细节

实验结果

总结

首页

科技周边

人工智能

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

王林

Jun 03, 2023 pm 08:49 PM

ai 模型

随着生成式大模型的不断进步，它们生成的语料正逐步逼近人类。虽然大模型正在解放无数文书的双手，它以假乱真的强劲能力也为一些不法分子所利用，造成了一系列社会问题：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

来自北大、华为的研究者们提出了一种识别各式 AI 生成语料的可靠文本检测器。根据长短文本的不同特性，提出了一种基于 PU 学习的多尺度 AI 生成文本检测器训练方法。通过对检测器训练过程的改进，在同等条件下能取得在长、短 ChatGPT 语料上检测能力的可观提升，解决了目前检测器对于短文本识别精度低的痛点。

论文地址：https://arxiv.org/abs/2305.18149
代码地址 (MindSpore)：https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt
代码地址 (PyTorch)：https://github.com/YuchuanTian/AIGC_text_detector

引言

随着大语言模型的生成效果越发逼真，各行各业迫切需要一款可靠的 AI 生成文本检测器。然而，不同行业对检测语料的要求不同，例如在学术界，普遍需要对大段完整的学术文本进行检测；在社交平台上，需要对相对简短而较为支离破碎的假消息进行检测。然而，既有检测器往往无法兼顾各式需求。例如，主流的一些 AI 文本检测器对较短的语料预测能力普遍较差。

对于不同长度语料的不同检测效果，作者观察到较短的 AI 生成文本可能存在着一部分归属上的「不确定性」；或者更直白地说，由于一些 AI 生成短句同时也常常被人类使用，因而很难界定 AI 生成的短文本是否来自于人或 AI。这里列举了几个人和 AI 分别对同一问题做出回答的例子：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

由这些例子可见，很难对 AI 生成的简短回答进行识别：这类语料与人的区别过小，很难严格判断其真实属性。因此，将短文本简单标注为人类 / AI 并按照传统的二分类问题进行文本检测是不合适的。

针对这个问题，本研究将人类 / AI 的二分类检测部分转化为了一个部分 PU（Positive-Unlabeled）学习问题，即在较短的句子中，人的语言为正类（Positive），机器语言为无标记类（Unlabeled），以此对训练的损失函数进行了改进。此改进可观地提升了检测器在各式语料上的分类效果。

算法细节

在传统的 PU 学习设定下，一个二分类模型只能根据正训练样本和无标记训练样本进行学习。一个常用的 PU 学习方法是通过制定 PU loss 来估计负样本对应的二分类损失：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

其中，识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了表示正样本与正标签计算的二分类损失；表示将无标记样本全部假定为负标签计算的二分类损失；表示将正样本假定为负标签计算的二分类损失；表示的是先验正样本概率，即正样本在全部 PU 样本中的预估占比。在传统的 PU 学习中，通常将先验识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了设置为一个固定的超参数。然而在文本检测的场景中，检测器需要处理各式长度不同的文本；而对于不同长度的文本而言，其正样本在所有和该样本相同长度的 PU 样本中的预估占比也是不同的。因此，本研究对 PU Loss 进行了改进，提出了长度敏感的多尺度 PU（MPU）loss 损失函数。

具体地，本研究提出了一个抽象的循环模型对较短文本检测进行建模。传统的 NLP 模型在处理序列时，通常是一个马尔可夫链的结构，如 RNN、LSTM 等。此类循环模型的这个过程通常可以理解为一个逐渐迭代的过程，即每个 token 输出的预测，都是由上一个 token 及之前序列的预测结果和该 token 的预测结果经过变换、融合得到的。即以下过程：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

为了根据这个抽象的模型进行先验概率的估计，需要假定该模型的输出为某个句子为正类（Positive）的置信度，即判定为人说出的样本的概率。假设每个 token 的贡献大小为句子 token 长度的反比，是非正（Positive）即无标记（Unlabeled）的，且为无标记的概率远远大于为正的概率。因为随着大模型的词汇量逐渐逼近人类，绝大部分词汇会同时出现在 AI 和人类语料中。根据这个简化后的模型和设定好的正 token 概率，通过求出不同输入情况下模型输出置信度的总期望，来得到最终的先验估计。

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

通过理论推导和实验，估计得到先验概率随着文本长度的上升而上升，最终逐渐稳定。这种现象也符合预期，因为随着文本变长，检测器可以捕捉的信息更多，文本的「来源不确定性」也逐渐减弱：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

之后，对于每个正样本，根据其样本长度得到的独特先验对 PU loss 进行计算。最后，由于较短文本仅有部分 “不确定性”（即较短文本也会含有一些人或者 AI 的文本特征），可以对二分类 loss 和 MPU loss 进行加权相加，作为最终的优化目标：

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

此外需要注意的是，MPU loss 适配的是长度较为多样的训练语料。倘若既有的训练数据单质化明显，大部分语料为大段冗长的文本，则无法全面发挥 MPU 方法的功效。为了使得训练语料的长度更多样化，本研究还引入了一个在句子层面进行多尺度化的模块。该模块随机遮盖训练语料中的部分句子，并对余下句子在保留原有顺序的前提下进行重组。经过训练语料的多尺度化操作，训练文本得到了长度上的极大丰富，从而充分利用了 PU 学习进行 AI 文本检测器训练。

实验结果

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

如上表所示，作者先在较短的 AI 生成语料数据集 Tweep-Fake 上检验 MPU loss 的效果。该数据集中的语料均为推特上较为短小的语段。作者又在传统的语言模型微调基础上将传统二分类 loss 替换为含有 MPU loss 的优化目标。改进之后的语言模型检测器效果较为突出，超过了其它基线算法。

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

作者又对 chatGPT 生成文本进行了检测，经过传统微调得到的语言模型检测器在短句上表现较差；经过 MPU 方式在同等条件下训练得到的检测器在短句上表现良好，且同时能够在完整语料上取得可观的效果提升，F1-score 提升了 1%，超越了 OpenAI 和 DetectGPT 等 SOTA 算法。

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

如上表所示，作者在消融实验中观察了每个部分带来的效果增益。MPU loss 加强了长、短语料的分类效果。

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

作者还对比了传统 PU 和 Multiscale PU（MPU）。由上表可见 MPU 效果更胜一筹，能更好地适配 AI 多尺度文本检测的任务。

总结

作者通过提出基于多尺度 PU 学习的方案，解决了文本检测器对于短句识别的难题，随着未来 AIGC 生成模型的泛滥，对于这类内容的检测将会越来越重要。这项研究在 AI 文本检测的问题上迈出了坚实的一步，希望未来会有更多类似的研究，把 AIGC 内容进行更好的管控，防止 AI 生成内容的滥用。

以上是识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7940

Java教程

1652

CakePHP 教程

1412

Laravel 教程

1303

PHP教程

1250

显示更多

Related knowledge

靠谱的数字货币交易平台推荐全球十大数字货币交易所排行榜2025 Apr 28, 2025 pm 04:30 PM

靠谱的数字货币交易平台推荐：1. OKX，2. Binance，3. Coinbase，4. Kraken，5. Huobi，6. KuCoin，7. Bitfinex，8. Gemini，9. Bitstamp，10. Poloniex，这些平台均以其安全性、用户体验和多样化的功能着称，适合不同层次的用户进行数字货币交易

全球币圈十大交易所有哪些排名前十的货币交易平台最新版 Apr 28, 2025 pm 08:09 PM

全球十大加密货币交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex，均提供多种交易方式和强大的安全措施。

排名靠前的货币交易平台有哪些最新虚拟币交易所排名榜前10 Apr 28, 2025 pm 08:06 PM

目前排名前十的虚拟币交易所：1.币安，2. OKX，3. Gate.io，4。币库，5。海妖，6。火币全球站，7.拜比特，8.库币，9.比特币，10。比特戳。

排名前十的虚拟币交易app有哪最新数字货币交易所排行榜 Apr 28, 2025 pm 08:03 PM

Binance、OKX、gate.io等十大数字货币交易所完善系统、高效多元化交易和严密安全措施严重推崇。

全球币圈十大交易所有哪些排名前十的货币交易平台2025 Apr 28, 2025 pm 08:12 PM

2025年全球十大加密货币交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex，均以高交易量和安全性着称。

怎样在C 中测量线程性能？ Apr 28, 2025 pm 10:21 PM

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析，步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析，步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能，并优化代码。

解密Gate.io战略升级：MeMebox 2.0如何重新定义加密资产管理？ Apr 28, 2025 pm 03:33 PM

MeMebox 2.0通过创新架构和性能突破重新定义了加密资产管理。1) 它解决了资产孤岛、收益衰减和安全与便利悖论三大痛点。2) 通过智能资产枢纽、动态风险管理和收益增强引擎，提升了跨链转账速度、平均收益率和安全事件响应速度。3) 为用户提供资产可视化、策略自动化和治理一体化，实现了用户价值重构。4) 通过生态协同和合规化创新，增强了平台的整体效能。5) 未来将推出智能合约保险池、预测市场集成和AI驱动资产配置，继续引领行业发展。

比特币值多少美金 Apr 28, 2025 pm 07:42 PM

比特币的价格在20,000到30,000美元之间。1. 比特币自2009年以来价格波动剧烈，2017年达到近20,000美元，2021年达到近60,000美元。2. 价格受市场需求、供应量、宏观经济环境等因素影响。3. 通过交易所、移动应用和网站可获取实时价格。4. 比特币价格波动性大，受市场情绪和外部因素驱动。5. 与传统金融市场有一定关系，受全球股市、美元强弱等影响。6. 长期趋势看涨，但需谨慎评估风险。

See all articles

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

引言

算法细节

实验结果

总结

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题