プログラマーは本当に危険にさらされています!
最近、OpenAI が、ソフトウェア エンジニアリングを真に習得し、「ジュニア プログラマー」を完全に置き換えるために、人間の思考プロセスを学習できるように ChatGPT を密かにトレーニングしたというニュースがありました。
シリコンバレーの大手企業数社が、プログラミング可能なAIの開発に取り組んでいる。
DeepMind の AlphaCode は「人間のプログラマーの 72% を打ち負かす」と言われていますが、まだオープンされていません; 噂されている Google の「謎のプロジェクト」Pitchfork もまだ準備中です; そして Microsoft の GitHub Copilot は主にコード補完ツールです。
人間のプログラマーに完全に取って代わる資格はありません。
しかし、もし ChatGPT が人間の思考を使ってプログラミングすることを本当に学習したら、これらの友人や自社の製品は打ちのめされるかもしれません。
あらゆる兆候から見て、OpenAI は大きな勝負をしているようです。
Semafor のレポートによると、OpenAI は過去 6 か月間で、AI コードをトレーニングするためにラテンアメリカや東ヨーロッパなどの地域から約 1,000 人の外部委託要員を採用しました。
このニュースには「素晴らしい点」が2つあります。
まず第一に、なぜラテンアメリカと東ヨーロッパが選ばれたのでしょうか?シリコンバレーのバブルが崩壊した今、大手インターネット企業は「コスト削減と効率向上」に知恵を絞っており、解雇に頼る企業もあれば、安い労働力を求めて他国へ行く企業もある。
2 番目の「華点」は、これらのアウトソーシング担当者の多くがコンピューター サイエンスの卒業生ではなく、高度なプログラミング スキルを持っていないことです。彼らの役割は、OpenAI が実現したい「自動化」のための基本的なコードを書くことです。
具体的には、そのうちの 60% が、人工知能ツールや自動運転車を訓練するために大量の画像、音声クリップ、その他の情報を作成する「データ アノテーション」作業に従事しています。
残りの 40% は実際のプログラマーで、AI がソフトウェア エンジニアリングのタスクを学習できるように、OpenAI のモデルのデータを「手作業でスクラブ」しています。
以前、OpenAI は GitHub から取得したコードを使用してモデルをトレーニングしていました。
今回、OpenAI が構築しようとしているデータセットにはコードが含まれているだけでなく、その背後に自然言語で書かれた人間による説明も含まれています。
論文アドレス: https://arxiv.org/abs/2107.03374
これに関して、Semafor は南米の開発者に特別にインタビューしました。 OpenAI の 5 時間のコーディング テストを無料で完了しました。
このテストでは、彼は 2 つのタスクを処理するように求められました。
まず、彼にプログラミングの問題が与えられ、OpenAI は彼に、その問題にどのようにアプローチするかを英語で説明するよう求めます。
次に、解決策を提供する必要があります。
彼がバグを見つけた場合、OpenAI は単にそれを修正するのではなく、問題の内容とそれをどのように修正する必要があるかを詳しく尋ねます。
「彼らはおそらく、このモデルにフィードするために非常に特殊な種類のトレーニング データを使用したいと考えているでしょう。この場合、人間がどのように考えるかを段階的に示す必要があります。」と開発者は言いました。
前回の ChatGPT では、記述されたコードに多くの問題が見つかりました。
その理由は、ChatGPT には正しいか間違っているかを示す内部記録がなく、実際には統計モデルであるためです。 ChatGPT の答えは基本的に、GPT-3 を構成するインターネット データのコーパスから集められた確率的な結果です。
OpenAIは当時、ChatGPTの最適な位置付けはコーディング支援ツールであるべきだとも述べていた。
しかし、OpenAI が本当に ChatGPT に「人間のように段階的に考える」ことを教えたとしたら、丸暗記を必要とするコーディング作業の一部を完全に置き換えることができると想像してください。一部の「ジュニア」プログラマーは完全に排除されるということです。
現在、シリコンバレーの幹部たちは、プログラミングの経験がほとんどない人でも自分のアイデアやビジョンを AI に説明して、それが Web サイトであろうと、何でも好きなものを構築できる製品を構想しています。Web サイトはまだゲームです。
数日前、テスラの元人工知能責任者、アンドレイ・カルパシー氏はツイッターで「最も注目されている新しいプログラミング言語は英語だ」と述べたばかりだ。
これは冗談ではないかもしれません。たとえば、人気のある ChatGPT には大きな可能性があります。
最近、マインツ大学とユニバーシティ カレッジ ロンドンの研究で、ChatGPT がバグ修正に優れているだけでなく、開発者が会話を通じて成功率を大幅に向上できることがわかりました。
研究者らは、ChatGPT のデバッグ パフォーマンスは、一般的な深層学習手法である CoCoNut や Codex のデバッグ パフォーマンスとほぼ同じであり、標準的な自動プログラム修復手法 (APR) よりも大幅に優れていると述べています。
論文アドレス: https://arxiv.org/abs/2301.08653
ChatGPT を使用してコードの問題を解決することは新しいことではありませんが、人間と対話することはユニークです他の方法やモデルよりも優れた機能を備えています。
ChatGPT のデバッグ パフォーマンスを評価するために、研究者らは QuixBugs ベンチマークの 40 の純粋な Python 問題を使用してテストし、提案された解決策が正しいかどうかを手動でチェックしました。
ChatGPT によって得られる回答にはある程度のランダム性があるため、研究者は各質問を個別に 4 回テストしました。
他の自動プログラム修復ベンチマークとは異なり、QuixBugs には比較的小さな問題 (コード行数が少ない) が含まれており、会話型システムでの使用に最適です。
テスト中、研究者はすべてのコメントを削除し、このコードにバグがあるかどうかとその修正方法を ChatGPT に尋ねました。
たとえば、図 1 は BITCOUNT 問題の例です。このうち、1~2行目はChatGPTへのリクエストで、4行目以降は間違ったコードスニペットです。
この例では、ChatGPT の回答によって 7 行目のエラーが解決されることを願っています。つまり、 n^= n - 1 を n &= n - 1 に置き換える必要があります。それに応じて、ChatGPT は修正コードを提供するか、コードを変更する方法の説明を提供します。
結果は、ChatGPT が 40 件のバグのうち 19 件を解決したことを示しており、これは CoCoNut (19) や Codex (21) と同等ですが、標準の APR 手法では 40 件のバグのうち 19 件しか解決されませんでした。 7 つの質問。
もちろん、ChatGPT と Codex はどちらも同じ言語モデル シリーズに属するため、解決される問題の数がほぼ同じであることは驚くべきことではありません。
さらに、結果を詳しく見ると、ChatGPT がベンチマークのバグを毎回解決しているわけではないこともわかります。 BUCKETSORT と FLATTEN の 2 つの問題だけで 4 回バグが見つかりましたが、他の問題は通常 1 ~ 2 回しか成功しませんでした。
つまり、実際に使用する場合、正しい結果が得られるまでに何度も試行する必要がある可能性があります。
ただし、ChatGPT には強力な利点があります。会話中にシステムと対話し、質問をより詳細に説明し、正しい答えを得ることができます。
実際のテスト結果は確かに同じです。
モデルとのさらなる対話の後、研究者らは ChatGPT の精度を 77.5% に更新することに成功しました。これは、40 個のエラーのうち 31 個が修正されたことを意味し、SOTA をはるかに上回っています。
#少なくとも、今のところは可能だと思われます。開発者は定型コードを記述する必要がなくなりました。
代わりに、複雑なアプリケーション アーキテクチャやネットワーク セキュリティなどの分野に集中できます。
とはいえ、ChatGPT は一般的な関数や定型コードの作成など、プログラミング作業を行うことはできますが、プログラマーを完全に置き換えることはできません。プログラマーの仕事は単にコードを書くだけではないからです。
プログラマーになるにはスキルが必要です。つまり、プログラムを構築し、ロジックに従い、各部分の合計よりも優れたものを生み出す能力です。
明らかに、ChatGPT はコーダーによって作成された最初の「自己反復」製品ではありません。
コードを書けるAIを並べてみましょう。
Google のピッチフォーク
昨年 11 月、Google が秘密プロジェクトを準備しているという噂がありました。この製品は、機械学習を使用してコードをトレーニングし、プログラム自体をプログラムし、自身を修復するものです。 . バグがあり、自分でアップデートすることができます。
この件に詳しい関係者によると、このプロジェクトはもともとアルファベットの月面着陸部隊、コードネーム「ピッチフォーク」のX部門によって開発され、最後にGoogle Labsに移管されたという。夏。
内部情報によると、Pitchfork の役割は「コードにコード自体の記述と書き換えを教える」ことです。
さまざまなプログラミング スタイルを学習し、これらのスタイルに従ってコードを作成できます。
Google の従業員は、Pitchfork 開発の当初の目的は、Google の Python コード ベースを新しいバージョンに更新するツールを構築することであったと述べました。
AlphaCode: プログラマーの 72% を破る
2022 年 2 月、DeepMind は、人工知能を使用してコードを生成できる「AlphaCode」システムを開始しました。
DeepMind によると、AlphaCode は人間に匹敵する可能性があります。
DeepMind は、プログラミング コンテスト プラットフォーム Codeforces で主催されている 10 の既存のコンテストを使用して AlphaCode をテストし、全体で上位 54.3% にランクされました。これは、参加者の 46% を上回ったことを意味します。
DeepMind は、プログラミング コンペティション プラットフォーム Codeforces を使用してテストしたところ、AlphaCode は 100 万サンプルの問題の 34.2% を解決したと主張しています。
また、過去 6 か月間にコンテストに参加したユーザーのうち、AlphaCode のデータは上位 28% にランクされ、「72% を上回った」と言えます。人間プログラマーの!
当時、DeepMind は、AlphaCode は現時点では競技プログラミングの分野にのみ適しているが、将来の機能がそれだけにとどまらないことは明らかであると指摘しました。
これは、プログラミングをよりアクセスしやすく、いつか完全に自動化するツールの作成への扉を開きます。
Copilot: コード補完アーティファクト
さらに、2021 年に GitHub と OpenAI は共同で AI プログラミング アーティファクト GitHub Copilot を開始しました。
コードを入力すると、Python や JavaScript で話すように訓練されたオートコンプリート ロボットと同じように、Copilot はプログラム内で次に表示されるコード スニペットを自動的に表示します。
Copilot は、特に複雑または創造的でない限り、必要なコード ブロックを埋めることができます。これは、手作業によるプログラミングと同等の場合に非常に役立ちます。
2022 年 6 月 22 日、Copilot は C サイド向けに正式に開始され、価格は月額 10 米ドルまたは年間 100 米ドルで、学生ユーザーと人気のオープンソース プロジェクトのメンテナに無料で提供されます。
現在、何千人もの開発者が Copilot を使用しています。最も一般的な 12 の言語で書かれたコードの最大 40% が、コードの生成にこの言語に依存しています。
GitHub は、開発者が 5 年以内にコードの最大 80% を書くのに Copilot を使用すると予測しています。
Microsoft 最高技術責任者 Kevin Scott 氏も次のように述べています:「GitHub Copilot は何千もの異なる種類の作業に適用できると確信しています。」
しかし、侵害の申し立てにより、それは不可能でした。 5か月後、Copilotは怒ったプログラマーたちから90億ドルを求めて訴訟を起こされた。
そして、「ソフトウェア工学的思考」を学んだChatGPTは彼らを倒すことができるのでしょうか? OpenAI のペースであれば、それほど長く待つ必要はないと思います。
https://www.semafor.com/article/01/27/2023/openai-has-hired-an-army-of-contractors-to-make - Basic-coding-obsolete
https://www.zdnet.com/article/chatgpt-can-write-code-now-researchers-say-its-good-at-fixing-bugs-too/
以上がプログラマーは危険にさらされています! OpenAI は世界中でアウトソーシング部隊を募集し、ChatGPT コード農家を段階的に訓練していると言われていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。