ChatGPT は人間より 20 倍安価にデータに注釈を付け、タスクの 80% で有利です
データアノテーションとは、簡単に言うと、ソーシャルメディア上のコンテンツデータにラベルを付けたり、テーマやコンセプトごとに分類したり、立場や感情を判断したりすることです。これらの注釈付きデータは、NLP モデルのトレーニング セットまたは評価基準として使用できます。
もう 1 つの「人間の仕事」が AI に奪われ、それは AI のトレーニングと密接に関係しています:
データ アノテーション。
チューリッヒ大学の研究では、ChatGPT の前では人間にはコストや効率の点で何の利点もないことが判明しました:
- コストの点では、各ラベルの平均コストChatGPT の料金は 0.003 米ドル未満です。クラウドソーシング プラットフォームより 20 倍安い;
- 効率の点では、ChatGPT は関連性、スタンス、テーマなどのタスクにおいて 4:1 の優位性で人間を「粉砕」します。 。
この論文が公開された後、一部のネチズンは「トレーニング データの生成には手作業が必要である」という言葉は過去のものになったと嘲笑しました。
「古書の修復やデジタル化が加速するのではないか」との声も上がった。
一部の人々はこの興奮を見て、あまり真剣に受け止めず、次のようにツイートしました:
これはプラットフォームの仕事を直接奪っています労働者。
そういえば、ChatGPT はどのようにしてデータ アノテーション ワーカーの「仕事」を盗んだのでしょうか?
ChatGPT は 80% のタスクで優位性を持っています
まず、データ アノテーション作業の具体的な内容を理解する必要があります。
データアノテーションとは、簡単に言うと、ソーシャルメディア上のコンテンツデータにラベルを付けたり、テーマやコンセプトごとに分類したり、立場や感情を判断したりすることです。
これらの注釈付きデータは、NLP モデルのトレーニング セットまたは評価基準として使用できます。
以前はこの種の作業は手作業で行われていましたが、たとえば MTurk はデータ アノテーションに特化したクラウドソーシング プラットフォームです。
MTurk などのクラウドソーシング プラットフォーム内では、専門的な訓練を受けたデータ アノテーターやクラウドソーシング ワーカーなど、より洗練された分業が行われることになります。
前者は高品質なデータが得られるメリットがあるものの、当然コストも高くなります。後者は安価ではあるものの、タスクの難易度によって品質が変動します。
そこで研究チームは、この分野における大規模言語モデル (LLM) の可能性を研究し始め、追加のトレーニングなし (ゼロショット) で ChatGPT (GPT-3.5 ベース) と MTurk のデータ アノテーションを比較しました。パフォーマンス。
この比較は、研究チームが以前に収集した 2,382 件のツイート サンプルに基づいています。
ChatGPT と MTurk は、それぞれ「関連性、立場、テーマ、ポリシー、実用性」という 5 つのタスクでツイートをマークします。
評価基準は 2 つあります:
- 精度: ChatGPT および MTurk クラウドソーシング ワーカーと比較した正しいアノテーションの割合;
- コーダー間の一貫性の信頼性: 以下を使用して計算されます。 ChatGPT、MTurk クラウドソーシング ワーカー、プロのデータ アノテーターのいずれか 2 つの間の一貫性;
結果も明らかであり、精度の点では、ChatGPT は 5 つのタスクのうち 4 つで MTurk クラウドソーシング ワーカーを上回っています。
一貫性の信頼性の点で、ChatGPT はすべてのタスクにおいてプロのデータ アノテーターを上回りました。
コストの点では、冒頭で述べたように、AI が 24 時間 * 7 稼働できることは言うまでもなく、ChatGPT は手作業に比べて平均して 20 倍安価です。
しかし、すべてのネチズンが研究チームが到達した結論に同意したわけではなく、一部の人は次のように言いました:
これら 5 つのタスクは単一すぎる。 、難易度も同様です。これだけを根拠としたそのような結論の信頼性には疑問があります。
一部のネチズンは、調査サンプルが少なすぎると嘲笑しました。
(実際には) サンプルとして使用されたツイートはわずか 2,382 件でした。
「雇用の脅威」はデータのラベル付けを超えます
現時点では、AI が特定の種類の仕事を完全に置き換えるかどうかを言うのは困難です、しかし、それは人間の仕事にある程度の影響を与えることは間違いありません。
先週、OpenAI は、ジョブの 80% が ChatGPT によってある程度の影響を受け、ジョブの 19% が ChatGPT によって深刻な影響を受けるだろうという分析レポートを発表しました。
そして、給与が高い職業はさらに大きな打撃を受けることになる。
OpenAI はさらに、影響を受ける具体的な職業を最大から最小まで列挙しました:
翻訳者、テキスト作成者 (詩人、作家などを含む)、広報担当者、数学者、税務申告者、ブロックチェーン エンジニア、金融関係者、メディア関係者...
△図出典: OpenAI
さらに、OpenAI CEO の Altman 氏は、「既存の仕事の一部は AI に取って代わられるだろう」と何度も述べています。
つい最近、MidjourneyV5 のメジャー アップグレードにより、多くの人間の画家が自分たちの仕事が保証されていないと言うことになりました。
えーっと、まだ仕事を続けられると思いますか?
論文アドレス: https://arxiv.org/abs/2303.15056
参考リンク: https://twitter.com/arankomatsuzaki/status/1640521970608402435
以上がChatGPT は人間より 20 倍安価にデータに注釈を付け、タスクの 80% で有利ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

DDREASE は、ハード ドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージ デバイスなどのファイル デバイスまたはブロック デバイスからデータを回復するためのツールです。あるブロック デバイスから別のブロック デバイスにデータをコピーし、破損したデータ ブロックを残して正常なデータ ブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップ ファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。 リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

iPhone のモバイル データ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラー インターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する 場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください 修正 2 – データ モードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

マルチモーダル文書理解機能のための新しい SOTA!アリババの mPLUG チームは、最新のオープンソース作品 mPLUG-DocOwl1.5 をリリースしました。これは、高解像度の画像テキスト認識、一般的な文書構造の理解、指示の遵守、外部知識の導入という 4 つの主要な課題に対処するための一連のソリューションを提案しています。さっそく、その効果を見てみましょう。複雑な構造のグラフをワンクリックで認識しMarkdown形式に変換:さまざまなスタイルのグラフが利用可能:より詳細な文字認識や位置決めも簡単に対応:文書理解の詳しい説明も可能:ご存知「文書理解」 「」は現在、大規模な言語モデルの実装にとって重要なシナリオです。市場には文書の読み取りを支援する多くの製品が存在します。その中には、主にテキスト認識に OCR システムを使用し、テキスト処理に LLM と連携する製品もあります。
