いくつかの試行の後、その効果は確かに良くありません

ホームページ

テクノロジー周辺機器

OpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェックツールほど優れたものではありません。

OpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェックツールほど優れたものではありません。

PHPz

Apr 11, 2023 pm 03:19 PM

ai chatgpt

ChatGPT が昨年 11 月末、わずか 2 か月前に正式にリリースされたことを多くの人は忘れているかもしれませんが、それが引き起こした流行により、テクノロジー企業が追随し、ユニコーンスタートアップが誕生しました。学術界が論文受理の要件を変更するよう主導した。

ChatGPT が AI 分野で「禁止すべきかどうか」という大きな議論を引き起こした後、OpenAI の真正性識別ツールがついに登場しました。

OpenAI は 1 月 31 日、人間の著作物と AI が生成したテキストを区別する認識ツールのリリースを正式に発表しました。このテクノロジーは、独自の ChatGPT (GPT) によって生成されたコンテンツを識別するように設計されています。 3と他のモデルです。ただし、現時点では分類器の精度が懸念されているようです。OpenAIは、AI識別AIの高信頼精度率が約26％であるとブログで指摘しています。しかし同庁は、他の方法と併用すれば、AIテキストジェネレーターの悪用を防ぐことができると考えている。

「私たちが提案する分類子の目的は、AI が生成したテキストによって引き起こされる混乱を軽減することです。ただし、まだいくつかの制限があるため、他の方法の代替として使用する必要があります。主要な意思決定ツールとしてではなく、補足として」と OpenAI の広報担当者は電子メールでメディアに語った。「このようなツールがこの初期分類器で有用であるかどうかについてフィードバックを受けており、将来的には改善方法を共有したいと考えています。」特にテキスト生成 AI に対する熱意は高まっていますが、悪用に対する懸念がそれに対抗しています。批評家らは、これらのツールの作成者に対し、潜在的に有害な影響を軽減する措置を講じるよう求めている。

AI によって生成された大量のコンテンツに直面して、一部の業界は直ちに制限を課し、米国最大の学区のいくつかでは、ネットワークとデバイスでの ChatGPT の使用を禁止しました。、生徒の学習に影響を与えることを恐れていること、およびツールによって生成されるコンテンツの精度に影響を与えることを懸念しています。 Stack Overflowなどのウェブサイトも、人工知能のせいで通常の議論では役に立たないコンテンツがユーザーに氾濫するとして、ChatGPTで生成されたコンテンツをユーザーが共有することを禁止している。

#こうした状況は、AI 認識ツールの必要性を浮き彫りにしています。効果は満足できるものではありませんが、OpenAI AI Text Classifier は GPT シリーズとのアーキテクチャベンチマークを達成しています。 ChatGPT と同様、Web 上の多くの公開テキストの例でトレーニングされた言語モデルです。 ChatGPT とは異なり、テキストの一部が AI (ChatGPT だけでなく、テキスト生成 AI モデルから) によって生成された可能性を予測するために微調整されています。 OpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェックツールほど優れたものではありません。

具体的には、OpenAI は、OpenAI 自体を含む 5 つの異なる組織にわたる 34 のテキスト生成システムからのテキストを対象に、AI テキスト分類器をトレーニングしました。これらは、Wikipedia の類似した (ただし同一ではない) 人工テキスト、Reddit で共有されたリンクから取得した Web サイト、および OpenAI テキスト生成システム用に収集された一連の「人間のデモ」と組み合わせられました。

OpenAI テキスト分類子は、すべてのタイプのテキストに適しているわけではないことに注意してください。検出するコンテンツは少なくとも 1000 文字、または約 150 ～ 250 ワードである必要があります。論文検出プラットフォームのような盗作チェック機能はありません。テキスト生成 AI がトレーニングセットから「正解」をコピーすることがわかっていることを考えると、これは非常に不快な制限です。 OpenAIは、そのデータセットが英語順のため、子供や英語以外の言語で書かれたテキストでエラーが発生する可能性が高いと述べた。

検出器は、特定のテキストが AI によって生成されたかどうかを評価するときに、肯定的な「はい」または「いいえ」の答えを返しません。信頼レベルに応じて、テキストが AI によって生成される可能性は「非常に低い」(確率 10% 未満)、AI によって生成される可能性が「低い」(確率 10% から 45% の間)、「かどうか不明」とマークされます。それは、「AI によって生成された (確率 45% ～ 90%)」、「AI によって生成された可能性がある」(確率 90% ～ 98%)、または AI によって生成された「可能性が非常に高い」(確率 98% 以上) でした。

精度を除けば、画像認識 AI と非常によく似ています。 OpenAI によると、分類器は 9% の確率で人間が書いたテキストを AI が書いたテキストとして誤ってラベル付けします。

いくつかの試行の後、その効果は確かに良くありません

OpenAI は、AI テキスト分類器の成功率は約 26% であると主張しています。何人かのネチズンがそれを試したところ、認識効果が優れていることがわかりました。確かによくなかった。

著名な ML および AI 研究者の Sebastian Raschka 氏が試したところ、「うまくいかない」という評価を下しました。彼は、オリジナルの 2015 年版の Python ML 本を入力テキストとして使用しました。その結果を以下に示します。

ランディ・オルソン氏の序文部分は AI によって生成されたかどうか不明 (不明) として特定されました
彼自身の序文部分は、おそらく AI によって生成されたものであると特定されました
段落部分最初の章の #AI によって生成された可能性が高いと特定されました

#Sebastian Raschka 氏は、これは興味深い例だが、法外な紙の識別結果によって将来罰せられる可能性のある学生たちをすでに気の毒に思っていると述べました。

そこで彼は、そのようなモデルを導入したい場合は、混同マトリックスを共有してくださいと提案しました。そうしないと、教育者が採点にこのモデルを採用した場合、実世界に害を及ぼす可能性があります。また、偽陽性と偽陰性についてもある程度の透明性を確保する必要があります。

さらに、Sebastian Raschka がシェイクスピアの「マクベス」の最初のページの内容を入力したところ、OpenAI AI テキスト分類器は AI によって生成された可能性が非常に高い結果を返しました。まさにとんでもない！

AI ライティングツール Easy-Peasy.AI によって作成されたコンテンツを他の人がアップロードし、結果は次の方法によって決定されました。 OpenAI AI テキスト分類子 AI によって生成される可能性は非常に低いです。

#最後に、誰かが翻訳を繰り返す方法を使用して GPT3 にテキストを書き換えさせましたが、これも認識エンジンを騙しました。

要約すると、前方認識は不正確であり、逆方向認識も誤りであり、論文を修正するためのいくつかのテクニックです。透けません。少なくともAIテキストコンテンツ認識の分野では、OpenAIはまだまだ努力が必要なようだ。

以上がOpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェックツールほど優れたものではありません。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7439

CakePHP チュートリアル

1369

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

ブートストラップリストのサイズを変更する方法は？ Apr 07, 2025 am 10:45 AM

ブートストラップリストのサイズは、リスト自体ではなく、リストを含むコンテナのサイズに依存します。 BootstrapのグリッドシステムまたはFlexBoxを使用すると、コンテナのサイズを制御することで、リスト項目を間接的に変更します。

ブートストラップリストのネストを実装する方法は？ Apr 07, 2025 am 10:27 AM

ブートストラップのネストされたリストでは、スタイルを制御するためにブートストラップのグリッドシステムを使用する必要があります。まず、外層＆lt; ul＆gt;を使用します。および＆lt; li＆gt;リストを作成するには、内側のレイヤーリストを＆lt; div class =＆quot; row＆gt;に巻き付けます。 and＆lt; div class =＆quot; col-md-6＆quot;＆gt;内側のレイヤーリストに、内側の層リストが行の幅の半分を占めることを指定します。このように、内側のリストは正しいものを持つことができます

ブートストラップリストにアイコンを追加する方法は？ Apr 07, 2025 am 10:42 AM

アイコンをブートストラップリストに追加する方法：アイコンライブラリ（Font Awesomeなど）が提供するクラス名を使用して、アイコンをリストアイテム＆lt; li＆gt;に直接詰めます。 Bootstrapクラスを使用して、アイコンとテキストを調整します（たとえば、d-flex、Justify-content-wether、align-Items-center）。ブートストラップタグコンポーネント（バッジ）を使用して、数字またはステータスを表示します。アイコンの位置（Flex-Direction：Row-Reverse;）を調整し、スタイル（CSSスタイル）を制御します。一般的なエラー：アイコンは表示されません（違います

vue.jsのストリングをオブジェクトに変換するためにどのような方法が使用されますか？ Apr 07, 2025 pm 09:39 PM

vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse（）が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

VUEでエクスポートデフォルトによってエクスポートされたコンポーネントを登録する方法 Apr 07, 2025 pm 06:24 PM

質問：エクスポートデフォルトを通じてエクスポートされるVUEコンポーネントを登録する方法は？回答：3つの登録方法があります。グローバル登録：vue.component（）メソッドを使用して、グローバルコンポーネントとして登録します。ローカル登録：現在のコンポーネントとそのサブコンポーネントでのみ利用可能なコンポーネントオプションに登録します。動的登録：vue.component（）メソッドを使用して、コンポーネントが読み込まれた後に登録します。

MySQLインストール後にデータベースのパフォーマンスを最適化する方法 Apr 08, 2025 am 11:36 AM

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール（ShowProcessList、ShowStatus）を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。

Laravelの地理空間：インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件：MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか？データ移行または構造調整は必要ですか？ MySQLはこのような大きなデータ負荷に耐えることができますか？予備分析：キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

See all articles

OpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェック ツールほど優れたものではありません。

いくつかの試行の後、その効果は確かに良くありません

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

OpenAI は AI 生成のコンテンツ識別子を正式に開始しましたが、成功率はわずか 26% であり、ネチズン: 紙の盗作チェックツールほど優れたものではありません。