Rumah > Peranti teknologi > AI > teks badan

ChatGPT 'Nemesis': Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

王林
Lepaskan: 2023-04-29 11:25:06
ke hadapan
1850 orang telah melayarinya

Kemunculan ChatGPT telah membolehkan ramai orang melihat fajar pekerjaan besar pada penghujung tarikh akhir (kepala anjing manual).

Sama ada kertas Bahasa Inggeris atau nota bacaan, selagi ia berada dalam skop pengetahuan ChatGPT, anda boleh memintanya untuk membantu anda menyelesaikannya, dan kandungan bertulis akan berasas.

Namun, pernahkah anda terfikir bahawa guru anda juga merancang untuk menggunakan sesuatu seperti "pengesan teks AI" untuk mengelakkan anda daripada menipu?

Masukkan nota yang kelihatan sempurna seperti ini Selepas beberapa ujian, ia menyimpulkan bahawa kemungkinan teks ini "ditulis oleh AI" (Palsu) adalah 99.98%!

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

△Teks dijana oleh ChatGPT

Cuba kertas matematik lain? Output ChatGPT nampaknya tiada masalah, tetapi ia masih dikenali dengan tepat olehnya:

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

△Teks dijana oleh ChatGPT

Ini bukan dilakukan secara membuta tuli atau Teka, selepas semua, pihak lain juga AI, dan AI yang terlatih.

Melihat perkara ini, beberapa netizen bergurau: Gunakan sihir untuk mengalahkan sihir?

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Gunakan perkara yang ditulis oleh AI untuk melatih AI baharu

Pengesan AI ini dipanggil Pengesan Output GPT-2 Ia adalah usaha sama antara OpenAI dan Harvard Universiti dan universiti lain Diwujudkan bersama-sama organisasi. (Ya, OpenAI membuatnya dengan sendirinya)

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Masukkan lebih daripada 50 aksara (token) untuk mengenal pasti teks yang dihasilkan oleh AI dengan lebih tepat.

Tetapi model yang mengkhususkan diri dalam mengesan GPT-2 adalah sama berkesan dalam mengesan teks yang dijana oleh AI lain.

Pengarang mula-mula mengeluarkan set data "kandungan terjana GPT-2" dan WebText (khusus daripada Reddit, bar siaran asing) untuk membolehkan AI memahami perbezaan antara "bahasa AI" dan "pertuturan manusia" perbezaan.

Seterusnya, set data ini digunakan untuk memperhalusi model RoBERTa, dan pengesan AI diperolehi.

RoBERTa (Pendekatan BERT Dioptimumkan Teguh) ialah versi BERT yang dipertingkatkan. BERT asal menggunakan set data 13GB, tetapi RoBERTa menggunakan set data 160GB yang mengandungi 63 juta item berita Inggeris.

Antaranya, pertuturan manusia sentiasa diiktiraf sebagai Benar, dan kandungan yang dihasilkan AI sentiasa diiktiraf sebagai Palsu.

Sebagai contoh, ini adalah sekeping kandungan yang disalin daripada blog Inggeris Medium. Berdasarkan hasil pengiktirafan, jelas penulis menulisnya sendiri (manual dog head):

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

△Sumber teks Medium@Megan Ng

Of sudah tentu, pengesanan ini Peranti juga tidak 100% tepat.

Semakin besar bilangan parameter model AI, semakin sukar untuk kandungan yang dijana untuk dikenal pasti Contohnya, model dengan 124 juta parameter mempunyai kebarangkalian yang lebih tinggi untuk "ditangkap" daripada model dengan 1.5. bilion parameter.

Pada masa yang sama, lebih tinggi rawak hasil penjanaan model, lebih rendah kebarangkalian kandungan yang dijana AI dikesan.

Tetapi walaupun model dilaraskan untuk menjana rawak tertinggi (Suhu=1, semakin hampir kepada 0, semakin rendah rawak), kebarangkalian untuk dikesan oleh model 124 juta parameter masih 88%, dan model parameter 1.5 bilion masih dikesan Kebarangkalian pengesanan masih 74%.

Ini adalah model yang dikeluarkan oleh OpenAI dua tahun lalu, kandungan yang dihasilkan oleh GPT-2 adalah "tepat".

Kini menghadapi versi ChatGPT yang dipertingkatkan, kesan pengesanan kandungan jana bahasa Inggeris masih boleh dicapai.

Tetapi apabila bercakap tentang bahasa Cina yang dijana oleh ChatGPT, keupayaan pengecamannya tidak begitu baik. Sebagai contoh, biarkan ChatGPT menulis gubahan:

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Pengesan AI memberikan kebarangkalian 99.96% bahawa ia ditulis oleh manusia...

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Sudah tentu, setelah berkata demikian, ChatGPT juga boleh mengesan teks yang dihasilkannya.

Oleh itu, tidak ditolak bahawa guru akan menyerahkan kerja rumah anda terus kepada ChatGPT untuk pengenalan:

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

One More Thing

Perlu disebut Ya, ChatGPT berkata bahawa ia tidak boleh mengakses Internet untuk mencari maklumat.

Jelas sekali, ia tidak menyedari kewujudan pengesan AI Pengesan Output GPT-2:

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Jadi, seperti yang dikatakan netizen, bolehkah ChatGPT menjana kandungan yang "tidak dikesan oleh AI ​​detector"?

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Malangnya, saya tidak dapat:

ChatGPT Nemesis: Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan

Jadi lebih baik saya menulis kerja rumah yang besar itu sendiri.. .

Pautan Rujukan:[1]​https://weibo.com/1402400261/Mj7QtwRoH[2]https://github.com/openai/gpt-2-output-dataset/tree /master/detector[3] https://chat.openai.com​​/

[4]https://medium.com/user-experience-design-1/how-chatgpt -is-blowing-google- out-of-the-water-a-ux-breakdown-784340c25d57

Atas ialah kandungan terperinci ChatGPT 'Nemesis': Gunakan AI untuk mengecam teks yang dijana AI, dan nota bacaan kertas Bahasa Inggeris boleh dikesan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan