코더들이 정말 위험해요!
최근 OpenAI가 ChatGPT를 조용히 훈련시켜 인간의 사고 과정을 학습함으로써 소프트웨어 엔지니어링을 진정으로 마스터하고 "주니어 코더"를 완전히 대체할 수 있다는 소식이 있습니다.
여러 주요 실리콘밸리 회사들이 프로그래밍할 수 있는 AI를 개발하고 있습니다.
DeepMind의 AlphaCode는 "인간 프로그래머의 72%를 능가한다"고 하지만 아직 공개되지 않았다는 소문이 있는 Google의 "신비한 프로젝트" Pitchfork도 아직 준비 중이며 Microsoft의 GitHub Copilot은 주로 코드 완성입니다. 도구.
인간 코더를 완전히 대체할 자격이 없다고 말하는 것입니다.
그러나 ChatGPT가 인간의 사고를 사용하여 프로그래밍하는 방법을 실제로 배운다면 이러한 친구/자체 제품은 무너질 수 있습니다.
그리고 모든 징후로 볼 때 OpenAI는 큰 진전을 이루고 있는 것 같습니다.
Semafor의 보고서에 따르면 OpenAI는 지난 6개월 동안 AI 코드 교육을 위해 라틴 아메리카 및 동유럽 등 지역에서 약 1,000명의 아웃소싱 인력을 모집했습니다.
이 뉴스에는 두 가지 "멋진 점"이 있습니다.
먼저 라틴 아메리카와 동유럽 지역을 선택한 이유는 무엇인가요? 실리콘밸리의 거품이 터진 지금, 주요 인터넷 기업들은 '비용 절감과 효율성 증대'에 안간힘을 쓰고 있다.
두 번째 "화 포인트"는 이러한 아웃소싱 업체 중 상당수가 컴퓨터 공학을 전공하지도 않았고 고급 프로그래밍 기술도 갖고 있지 않다는 것입니다. 그들의 역할은 OpenAI가 달성하고자 하는 "자동화"를 위한 기본 코드를 작성하는 것입니다.
구체적으로 그 중 60%는 인공지능 도구나 자율주행차를 훈련시키기 위해 대량의 이미지, 오디오 클립 및 기타 정보를 생성하는 "데이터 주석" 작업에 종사하고 있습니다.
나머지 40%는 AI가 소프트웨어 엔지니어링 작업을 학습할 수 있도록 OpenAI 모델의 데이터를 "손으로 스크러빙"하는 실제 프로그래머입니다.
이전에 OpenAI는 GitHub에서 가져온 코드를 사용하여 모델을 훈련해 왔습니다.
이번 OpenAI가 구축하려는 데이터 세트에는 코드뿐만 아니라 그 뒤에 자연어로 작성된 인간의 설명도 포함됩니다.
논문 주소: https://arxiv.org/abs/2107.03374
이와 관련하여 Semafor는 무료로 5시간 동안 OpenAI 코딩 테스트를 완료한 남미 개발자를 구체적으로 인터뷰했습니다.
이번 테스트에서 그는 두 가지 작업을 처리하라는 요청을 받았습니다.
먼저 그에게 프로그래밍 문제가 주어지고 OpenAI는 그에게 문제에 어떻게 접근할지 영어로 설명해달라고 요청합니다.
그러면 그는 해결책을 제시해야 합니다.
버그를 발견하면 OpenAI는 단순히 고치는 것이 아니라 문제가 무엇인지, 어떻게 수정해야 하는지 자세히 설명해달라고 요청할 것입니다.
"그들은 아마도 이 모델에 매우 특별한 종류의 훈련 데이터를 사용하고 싶어할 것입니다. 이 경우 인간이 어떻게 생각하는지 단계별로 보여줄 필요가 있습니다."
이전에는 ChatGPT로 작성한 코드에서 많은 문제가 발견되었습니다.
그 이유는 ChatGPT에는 옳고 그름을 표시하는 내부 기록이 없기 때문입니다. 실제로는 통계 모델입니다. ChatGPT의 답변은 기본적으로 GPT-3를 구성하는 인터넷 데이터 모음에서 수집한 확률적 결과입니다.
OpenAI도 당시 ChatGPT의 가장 적합한 포지셔닝은 코딩 지원 도구가 되어야 한다고 말했습니다.
그러나 OpenAI가 실제로 ChatGPT에 "인간처럼 단계별로 생각"하도록 가르쳤다면 암기가 필요한 일부 코딩 작업을 완전히 대체할 수 있다고 상상해 보세요. 그 결과 일부 "주니어" 코더는 완전히 제거될 것입니다.
이제 Silicon Valley 경영진은 프로그래밍 경험이 거의 없는 사람들이 자신의 아이디어와 비전을 AI에 설명하고 웹사이트든 게임이든 원하는 것은 무엇이든 구축할 수 있는 제품을 구상하고 있습니다.
며칠 전 Tesla의 전 인공지능 책임자인 Andrej Karpathy는 트위터에서 "가장 인기 있는 새로운 프로그래밍 언어는 영어입니다."라고 말했습니다.
농담이 아닐 수도 있습니다. 예를 들어 인기 있는 프라이드치킨 ChatGPT는 큰 잠재력을 가지고 있습니다.
최근 마인츠 대학과 런던 대학의 연구에 따르면 ChatGPT는 버그 수정에 탁월할 뿐만 아니라 개발자도 대화를 통해 성공률을 크게 높일 수 있다는 사실이 밝혀졌습니다.
연구원들은 ChatGPT의 디버깅 성능이 일반적인 딥 러닝 방법인 CoCoNut 및 Codex와 거의 동일하며 표준 자동 프로그램 복구 방법(APR)보다 훨씬 우수하다고 밝혔습니다.
문서 주소: https://arxiv.org/abs/2301.08653
ChatGPT를 사용하여 코드 문제를 해결하는 것은 새로운 것이 아니지만 사람과 대화할 수 있는 고유한 능력은 다른 방법 및 모델에 비해 이점을 제공합니다.
ChatGPT의 디버깅 성능을 평가하기 위해 연구원들은 QuixBugs 벤치마크의 순수 Python 문제 40개를 사용하여 테스트한 후 제안된 솔루션이 올바른지 수동으로 확인했습니다.
ChatGPT에서 제공하는 답변에는 어느 정도 무작위성이 있기 때문에 연구원들은 각 질문을 개별적으로 4번 테스트했습니다.
다른 자동 프로그램 복구 벤치마크와 달리 QuixBugs에는 상대적으로 작은 문제(몇 줄의 코드)가 포함되어 있어 대화형 시스템에 사용하기에 이상적입니다.
테스트 과정에서 연구원들은 모든 댓글을 삭제하고 ChatGPT에 이 코드에 버그가 있는지와 해결 방법을 물었습니다.
예를 들어 그림 1은 BITCOUNT 문제의 예입니다. 그 중 1~2번째 줄은 ChatGPT에 대한 요청이고, 4번째 줄부터 시작하는 것은 잘못된 코드 조각입니다.
이 예에서는 ChatGPT의 답변이 7행의 오류를 수정하기를 바랍니다. 즉, nˆ= n - 1을 n &= n - 1로 바꿔야 합니다. 이에 대한 응답으로 ChatGPT는 고정 코드 조각을 제공하거나 코드 수정 방법에 대한 설명을 제공합니다.
결과에 따르면 ChatGPT는 버그 40개 중 19개를 해결했으며 이는 CoCoNut(19) 및 Codex(21)와 비슷하지만 표준 APR 방법은 그 중 7개만 해결했습니다.
물론 ChatGPT와 Codex는 모두 동일한 언어 모델 시리즈에서 나왔기 때문에 해결한 문제 수가 거의 같다는 것은 놀라운 일이 아닙니다.
또한 결과를 자세히 살펴보면 ChatGPT가 매번 벤치마크에서 버그를 해결하지 못하는 것을 확인할 수 있습니다. BUCKETSORT 및 FLATTEN 두 가지 이슈에서만 버그가 4번 발견된 반면, 다른 이슈에서는 일반적으로 1~2번만 성공했습니다.
즉, 사용자가 실제로 사용할 때 올바른 결과를 얻으려면 여러 번 시도해야 할 수도 있습니다.
그러나 ChatGPT에는 강력한 이점이 있습니다. 대화에서 시스템과 상호 작용하고, 질문을 더 자세히 설명하고, 정답을 얻을 수 있습니다.
실제 테스트 결과는 그야말로 동일합니다.
모델과의 추가 대화 후 연구원들은 ChatGPT의 정확도를 77.5%로 성공적으로 새로 고쳤습니다. 이는 40개의 오류 중 31개가 SOTA를 훨씬 초과하여 수정되었음을 의미합니다.
적어도 현재로서는 가능해 보입니다. 개발자는 더 이상 상용구 코드를 작성할 필요가 없습니다.
대신 복잡한 애플리케이션 아키텍처나 네트워크 보안과 같은 영역에 집중할 수 있습니다.
ChatGPT는 일반적인 기능이나 상용구 코드 작성과 같은 일부 프로그래밍 작업을 수행할 수 있지만 프로그래머를 완전히 대체하지는 않습니다. 프로그래머의 직업에는 단순히 코드를 작성하는 것 이상의 것이 필요하기 때문입니다.
프로그래머가 되려면 기술이 필요합니다. 프로그램을 구축하고, 논리를 따르고, 부분의 합보다 더 큰 것을 생산하는 능력입니다.
분명히 ChatGPT는 코더가 만든 최초의 "자체 반복" 제품이 아닙니다.
코드를 작성할 수 있는 AI를 한 줄로 나열해 보겠습니다.
Google의 Pitchfork
지난해 11월, 이 제품은 머신러닝을 이용해 코드를 학습시키고, 스스로 버그를 수정하고, 스스로 업데이트한다는 소문이 돌았습니다.
이 문제에 대해 잘 아는 사람들에 따르면 이 프로젝트는 원래 Alphabet의 Moonshot 부서인 X Division(코드명 Pitchfork)에서 개발되었으며 지난 여름 Google Labs로 이전되었습니다.
내부 정보에 따르면 피치포크의 역할은 "스스로 작성하고 다시 작성할 수 있는 코드를 가르치는 것"입니다.
다양한 프로그래밍 스타일을 배우고 이러한 스타일에 따라 코드를 작성할 수 있습니다.
Google 직원은 Pitchfork를 개발한 원래 의도는 Google의 Python 코드 기반을 새 버전으로 업데이트하는 도구를 만드는 것이라고 말했습니다.
알파코드: 프로그래머의 72%를 이기다
2022년 2월 딥마인드는 인공지능을 사용해 코드를 생성할 수 있는 '알파코드' 시스템을 출시했습니다.
DeepMind에 따르면 AlphaCode는 인간과 경쟁할 수 있습니다.
DeepMind는 프로그래밍 경쟁 플랫폼 Codeforces에서 주최하는 기존 10개 대회를 사용하여 AlphaCode를 테스트했으며 전체 상위 54.3%에 올랐습니다. 이는 참가자의 46%를 이겼다는 의미입니다.
DeepMind는 AlphaCode가 프로그래밍 경쟁 플랫폼 Codeforces를 사용하여 테스트했을 때 100만 샘플 문제의 34.2%를 해결했다고 주장합니다.
또한 지난 6개월 동안 대회에 참가한 사용자 중 알파코드의 데이터가 상위 28%에 랭크되었습니다. 이는 "인간 프로그래머의 72%를 이겼다"라고 할 수 있습니다!
당시 DeepMind는 AlphaCode가 현재 경쟁이 치열한 프로그래밍 분야에만 적합하지만 향후 역량은 여기서 멈추지 않을 것이 분명하다고 지적했습니다.
프로그래밍에 대한 접근성을 높이고 언젠가 완전 자동화할 도구를 만들 수 있는 문이 열립니다.
Copilot: 코드 완성 아티팩트
2021년에 GitHub와 OpenAI는 공동으로 AI 프로그래밍 아티팩트인 GitHub Copilot을 출시했습니다.
코드를 입력하면 Copilot은 Python 또는 JavaScript로 말하도록 훈련된 자동 완성 로봇처럼 프로그램에서 다음에 나타날 수 있는 코드 조각을 자동으로 표시합니다.
Copilot은 특별히 복잡하거나 창의적이지 않은 한 필요한 코드 블록을 채울 수 있어 수작업에 해당하는 프로그래밍에 매우 유용합니다.
2022년 6월 22일 Copilot은 C 측용으로 공식 출시되었으며 가격은 US$10/월 또는 US$100/년이며, 인기 오픈 소스 프로젝트의 학생 사용자 및 유지관리자에게 무료로 제공됩니다.
현재 수천 명의 개발자가 Copilot을 사용하고 있습니다. 가장 널리 사용되는 12개 언어로 작성된 코드 중 최대 40%가 이를 사용하여 코드를 생성합니다.
GitHub에서는 개발자가 Copilot을 사용하여 5년 내에 코드의 최대 80%를 작성할 것으로 예측합니다.
Microsoft 최고기술책임자(CTO) 케빈 스콧(Kevin Scott) 역시 "우리는 GitHub Copilot이 수천 가지 유형의 작업에 적용될 수 있다고 확신합니다."라고 밝혔습니다.
그러나 침해 혐의로 인해 출시 후 5개월도 채 지나지 않아 Copilot은 화가 난 프로그래머들은 90억 달러를 요구하며 법정에 출두했습니다.
'소프트웨어 공학적 사고'를 배운 ChatGPT는 과연 그들을 이길 수 있을까요? OpenAI의 속도라면 너무 오래 기다리지 않아도 될 것 같습니다.
https://www.semafor.com/article/01/27/2023/openai-has-hired-an-army-of-contractors-to-make-basic-coding-obsolete
https ://www.zdnet.com/article/chatgpt-can-write-code-now-researchers-say-its-good-at-fixing-bugs-too/
위 내용은 프로그래머가 위험에 빠졌습니다! OpenAI는 전 세계적으로 아웃소싱 인력을 모집하고 ChatGPT 코드 농부를 단계별로 교육한다고 합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!