目次
ChatGPT はバグ修正が得意です
コードを書くための ChatGPT のグローバル採用およびアウトソーシング トレーニング
実験の最初のラウンドでは、ChatGPT は QuixBugs データセットのビット数の問題を解決できませんでした。
ホームページ テクノロジー周辺機器 AI ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

Apr 15, 2023 am 09:16 AM
ai chatgpt データセット

ChatGPT はバグ修正においてどれくらい優れていますか?

最後に、この問題について真剣に研究している人がいます--

ドイツとイギリスの研究者が、ChatGPT の能力をテストするための「チャレンジ」を設定しました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ChatGPT に加えて、研究者らはバグを修正する他の 3 人の「AI ヒーロー」も発見し、それぞれ 40 個のエラー コードを修正するよう依頼しました。

結果は本当に未知数で、比べてみて衝撃を受けました。

ChatGPT は、2 位 (21 件) を大きく引き離して 31 件のバグを正確に修正し、「AI バグ修正の世界」で SOTA スコアを直接獲得しました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

それ以来、この研究は多くのネチズンの注目を集め、議論するようになりました。Reddit のこの投稿のタイトルには「注意」と「注意」という言葉も使われています。 :

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

# しかし実際、これは本当にプログラマーを「危険」にするのでしょうか?

まずこの研究を見てみましょう。

ChatGPT はバグ修正が得意です

ChatGPT はバグ修正を目的として特別に設計されたものではありませんが、その開始以来、多くのネチズンがこの機能があることを発見しました。

したがって、ChatGPT がバグをどの程度修正できるかを調べるために、研究者は標準エラー修復ベンチマーク セット QuixBugs を評価用に導入しました。

とそれと競合する AI プレーヤーは、それぞれ CodeX、CoCoNut、Standard APR です。

研究者らは QuixBugs から 40 個の問題を選択し、それぞれのバグを修正するよう依頼しました。

ChatGPT にバグを修正させる方法は、ダイアログ ボックスで質問することです:

このコードに何か問題がありますか?

第 1 ラウンドの対戦後の結果は次のとおりです。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

第 1 ラウンドの戦闘結果から判断すると、ChatGPT は修復されました。 19、CodeX 21 が修正され、CoCoNut が 19 で修正され、標準 APR は 7 でした。

そして研究者らは、ChatGPT の回答が CodeX に最も似ていることも発見しました。これは、それらが同じ言語モデル ファミリーに属しているためです。

このとき、友人の中には「ChatGPT は CodeX ほど強力ではないのでは?」と尋ねる人もいるでしょう。

心配しないでください。忘れないでください。ChatGPT の特徴の 1 つは、質問すればするほど、より良い結果が得られることです。

たとえば、このベンチマーク セットには、ビットカウントと呼ばれる質問があります。ChatGPT は、修復の最初のラウンドで間違った答えを返しました:

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

もともと、 ChatGPT は 7 行目の n ^ = n - 1 を n & = n - 1 に変更する必要があります。

しかし、最初のラウンドでは、次のような答えが返されました:

予想される動作と問題の原因となった入力に関する詳細な情報がなければ、プログラムにバグがあるかどうかわかりません。

したがって、さらに詳しい情報を提供した後、ChatGPT は質問に正しく答えました。

類推すると、最初のラウンドで正しく回答されなかった質問に対してより多くの情報プロンプトを提供した後、ChatGPT のバグ修正機能は大幅に改善されました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

# #最終的に、ChatGPT は QuixBugs の 40 の質問のうち 31 に正解しました。

ネチズンは複雑な感情を抱いています

このような実験結果に関して、ChatGPTのバグ修正とSOTAの勝利に対するネチズンの態度は異なります。

一部のネチズンは、この問題でプログラマーは危機を感じるべきではなく、幸せになれるはずだと信じています。

つまり、このような便利なツールがあれば、プログラマは半分の労力で 2 倍の結果が得られるということです。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ただし、これについては別の見方をする人もいます。

仕事が単純になったからといって、人手が増えるわけではありません。必要です。少ないですか?

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

しかし、一部のネチズンは、その作業に終わりがないと感じています:

AI によって開発時間が 1 桁短縮できたとしても、それはプログラマーが必要とするだけです。次のジョブがより速く処理されます。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

全体的に、ChatGPT はバグ修正に優れており、プログラマに致命的な害を与えることはありません。

しかし、OpenAI の他の活動に焦点を当てたらどうでしょうか?

コードを書くための ChatGPT のグローバル採用およびアウトソーシング トレーニング

これに先立ち、OpenAI は、ChatGPT の重要な用途の 1 つはプログラマがコードをチェックするのを支援することであると述べました。

つまり、補助的に利用できるツールという位置づけです。

「ChatGPT は脅威である」という見方に比べ、ChatGPT の機能が完全に進化すると、プログラマはバグを書くことを恐れる必要がなくなります。

OpenAI によって配置されたチェス盤には、バグを修正したり、タワー プログラマーの地位を盗んだりするだけではありません。

OpenAI をより大きく、より強力にするために、ラテンアメリカと東ヨーロッパで 1,000 件のアウトソーシング ポジションを提供することが公開されました。

外注従業員の主な仕事は、データにラベルを付け、コードを書くように ChatGPT をトレーニングすることです

これら 1,000 人のうち 40% がプログラマーです。彼らは OpenAI モデル用のデータを作成し、それをソフトウェアの学習に使用しますエンジニアリングタスク。

長い間、OpenAI のトレーニング データは GitHub から取得されてきました。

外部委託された初心者のプログラマが作成するデータ セットには、コード行だけでなく、コード行の背後にある人間の思考の論理的なステップも含まれるようになりました。

南米のソフトウェア開発者が、OpenAI の 5 時間の無料コーディング テストを完了したというニュースを発表しました。

プロセス全体を通じて、彼のタスクは 2 つの部分に分割されました。

  • コーディングの問題に対処する方法を英語で説明し、解決策を提供します。
  • バグが見つかった場合、OpenAI はバグの具体的な状況と修正方法について詳しく質問します。

プログラマは、問題について考える各ステップを示す必要があり、OpenAI が ChatGPT に非常に具体的なトレーニング データを提供したいのではないかと推測しています。

Tesla の元 AI ディレクター、アンドレイ・カルパシー氏は Twitter で次のように冗談を飛ばしました:

最近人気のあるプログラミング言語は英語です。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだそうは言っても、ChatGPT に強力なバグ修正機能があるのは良いことです。また、それが本当に進化できるのであれば、それも良いことです。コードの暗記部分を完了できるポイント。

結局のところ、OpenAI が設立されたときに表明された目的は、「汎用人工知能が全人類に利益をもたらすことを保証する」ということでした。

一見すると、この組織が長年にわたって行ってきたことは、一部の人々の努力を利用してより多くの人々を失業させることに取り組んでいるように見えます。

Dota2 アリーナでの人間の粉砕から GPT-3、DALL-E2、ChatGPT の輝かしいパフォーマンスまで、Dota2 がもたらす新製品には常に「xxx は職を失いそうだ」という議論がつきものです。 」

しかし、何があっても、ビジネスは常にそれを支持してきました。

現時点では、OpenAI の主なビジネス モデルは API 料金、トークン料金、ソフトウェア ライセンスです。

OpenAI は最近、ChatGPT の有料版 ChatGPT Pro もリリースしました。料金は月額 42 米ドル (約 285 人民元) です。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだロボット対話スタートアップが雨後の筍のように出現しているにもかかわらず、市場が引き続き OpenAI に対して楽観的である兆候は数多くあります。

Microsoft は、OpenAI に数十億ドルを投資し、OpenAI のモデルを Microsoft Bing などのコンシューマおよびエンタープライズ製品に統合すると発表しました。

関係者によると、追加投資額は約100億ドル。

同時にWSJは、1月初旬に億万長者のピーター・ティール氏が設立したベンチャーキャピタルファンドであるファウンダーズ・ファンドがOpenAIへの投資交渉を行っていることを明らかにした。

資金調達額は少なくとも3億ドルに達すると報じられている。

One More Thing

実験の最初のラウンドでは、ChatGPT は QuixBugs データセットのビット数の問題を解決できませんでした。

しかし、今もう一度この質問をすると、ChatGPT は「再び渡される」ことができることがわかります:

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだつまり、これは ChatGPT がから変更されました この研究中に問題を解決する方法を学びましたか?

参考リンク:

[1] https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08
[2] https://www.php. cn/link/8a47481ae534860850adf59f145e6b40
[3] https://www.php.cn/link/7806689d934e610d660caf5536fea0b2
[4] https://www.php.cn/link/4271846620d203fd0511c422d483cdbd

以上がChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ビットコインの価値はいくらですか ビットコインの価値はいくらですか Apr 28, 2025 pm 07:42 PM

ビットコインの価格は20,000ドルから30,000ドルの範囲です。 1。ビットコインの価格は2009年以来劇的に変動し、2017年には20,000ドル近くに達し、2021年にはほぼ60,000ドルに達しました。2。価格は、市場需要、供給、マクロ経済環境などの要因の影響を受けます。 3.取引所、モバイルアプリ、ウェブサイトを通じてリアルタイム価格を取得します。 4。ビットコインの価格は非常に不安定であり、市場の感情と外部要因によって駆動されます。 5.従来の金融市場と特定の関係を持ち、世界の株式市場、米ドルの強さなどの影響を受けています。6。長期的な傾向は強気ですが、リスクを慎重に評価する必要があります。

2025年のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの1つです 2025年のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの1つです Apr 28, 2025 pm 08:12 PM

2025年の世界の上位10の暗号通貨取引所には、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、Kucoin、Bittrex、Poloniexが含まれます。これらはすべて、高い取引量とセキュリティで知られています。

世界のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの最新バージョンです 世界のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの最新バージョンです Apr 28, 2025 pm 08:09 PM

世界の上位10の暗号通貨取引プラットフォームには、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、Kucoin、Poloniexが含まれます。これらはすべて、さまざまな取引方法と強力なセキュリティ対策を提供します。

復号化GATE.IO戦略のアップグレード:Memebox 2.0でCrypto Asset Managementを再定義する方法は? 復号化GATE.IO戦略のアップグレード:Memebox 2.0でCrypto Asset Managementを再定義する方法は? Apr 28, 2025 pm 03:33 PM

Memebox 2.0は、革新的なアーキテクチャとパフォーマンスのブレークスルーを通じて、暗号資産管理を再定義します。 1)3つの主要な問題点を解決します。資産サイロ、収入の減少、セキュリティと利便性のパラドックスです。 2)インテリジェントアセットハブ、動的リスク管理およびリターンエンハンスメントエンジン、クロスチェーン移動速度、平均降伏率、およびセキュリティインシデント応答速度が向上します。 3)ユーザーに、ユーザー価値の再構築を実現し、資産の視覚化、ポリシーの自動化、ガバナンス統合を提供します。 4)生態学的なコラボレーションとコンプライアンスの革新により、プラットフォームの全体的な有効性が向上しました。 5)将来的には、スマート契約保険プール、予測市場統合、AI主導の資産配分が開始され、引き続き業界の発展をリードします。

トップ10の仮想通貨取引アプリは何ですか?最新のデジタル通貨交換ランキング トップ10の仮想通貨取引アプリは何ですか?最新のデジタル通貨交換ランキング Apr 28, 2025 pm 08:03 PM

Binance、OKX、Gate.ioなどの上位10のデジタル通貨交換は、システムを改善し、効率的な多様化したトランザクション、厳格なセキュリティ対策を改善しました。

トップ通貨取引プラットフォームは何ですか?トップ10の最新の仮想通貨交換 トップ通貨取引プラットフォームは何ですか?トップ10の最新の仮想通貨交換 Apr 28, 2025 pm 08:06 PM

現在、上位10の仮想通貨交換にランクされています。1。Binance、2。Okx、3。Gate.io、4。CoinLibrary、5。Siren、6。HuobiGlobal Station、7。Bybit、8。Kucoin、9。Bitcoin、10。BitStamp。

推奨される信頼できるデジタル通貨取引プラットフォーム。世界のトップ10のデジタル通貨交換。 2025 推奨される信頼できるデジタル通貨取引プラットフォーム。世界のトップ10のデジタル通貨交換。 2025 Apr 28, 2025 pm 04:30 PM

推奨される信頼できるデジタル通貨取引プラットフォーム:1。OKX、2。Binance、3。Coinbase、4。Kraken、5。Huobi、6。Kucoin、7。Bitfinex、8。Gemini、9。Bitstamp、10。Poloniex、これらのプラットフォームは、セキュリティ、ユーザーエクスペリエンス、ユーザーエクスペリエンス、ユーザーエクスペリエンス、ユーザーエクスペリエンスのデジタルエクスペリエンス、デジタルエクスペリエンスのデジタルエクスペリエンス、デジタルエクスペリエンスのために知られています。

CでChronoライブラリを使用する方法は? CでChronoライブラリを使用する方法は? Apr 28, 2025 pm 10:18 PM

CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock:現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

See all articles