대형 모델들이 "인간 프로그래머 대체"의 길로 급속히 전진하고 있습니다. 올해 3월, 인공지능 소프트웨어 엔지니어 Devin이 AI 커뮤니티를 폭발시켰습니다. 이 제품은 OpenAI의 GPT-4 기본 대형 언어 모델(LLM)을 기반으로 하며 자연어 텍스트 지침을 받은 후 독립적으로 작성하고 편집할 수 있습니다. . 하지만 생성 AI 분야에서는 빠른 발전이 주요 테마이고, 이제 기술이 다시 반복되고 있습니다. 이번 주, Y Combinator가 지원하는 Cosine이라는 스타트업은 새로운 자율 AI 엔지니어 Genie의 출시를 발표했습니다. 회사는 Genie가 타사 벤치마크 SWE-Bench에서 30%를 기록하며 Devin을 쉽게 능가한 반면 Devin은 13.8%에 불과하다고 밝혔습니다. 새로운 도구는 Amazon의 Q와 Factory의 Code Droid를 19% 능가하며 현재 세계에서 가장 성능이 뛰어난 AI 프로그래머입니다. ㅋㅋㅋ > "이 모델은 벤치마크 그 이상입니다. 인간 SWE(소프트웨어 엔지니어)처럼 생각하고 행동한다는 목표로 처음부터 훈련되었습니다." Cosine Alistair Pullen의 공동 창립자 겸 CEO 말했다. 버그 수정과 코드 작성이 가능한 지니
지니는 인간 엔지니어의 지시에 따라 버그 수정, 기능 빌드 등 다양한 코딩 작업을 자율적으로 처리할 수 있는 고급 AI 소프트웨어 엔지니어링 모델입니다. 코드 리팩토링, 코드 테스트 등
Genie는 완전히 자율적으로 실행되거나 사용자와 협력하여 작업을 완료할 수 있습니다.
기술 보고서에 표시된 대로 JavaScript, Python, TypeScript, TSX, Java, C#, C++, C, Rust, Scala, Kotlin, Swift, Golang, PHP, Ruby를 포함한 여러 프로그래밍 언어를 지원합니다.
Cosine은 Genie가 인간 엔지니어의 인지 과정을 시뮬레이션할 수 있다고 주장합니다. "인간 엔지니어들이 어떻게 작업하는지 관찰하고 그 과정을 모방하게 하세요."
보안 문제는 항상 모든 사람의 관심사였습니다. Genie가 생성한 코드는 사용자의 GitHub 저장소에 저장되므로 Cosine은 코드 사본을 보관하지 않으므로 그에 따른 보안 위험을 피할 수 있습니다.
또한 Cosine의 소프트웨어 플랫폼에는 Slack과 시스템 알림이 통합되어 있어 마치 AI 동료처럼 사용자에게 상태를 알려주거나 문제를 신고할 수 있습니다.
Alistair Pullen이 Genie를 사용하여 실제 문제를 해결하는 방법을 보여줍니다. 대상은 GitHub의 문제입니다. 링크를 직접 연결하기만 하면 AI가 자동으로 문제를 분석하고 요구 사항이 충족될 때까지 문제를 해결하는 데 필요한 파일이 무엇인지 생각하기 시작합니다.
그런 다음 Genie는 문제를 여러 해결 단계로 나누고 코드를 생성하기 시작합니다. 다음 단계는 코드를 실행하는 것입니다. 생성된 코드에 문제가 있으면 자동으로 문제를 찾아서 분석하고 수정한 후 다시 실행을 시도합니다.
최종 출력 결과: 파일 2개, 테스트 17개, 단 84초.
인간 프로그래머보다 몇 배나 빠른지 모르겠습니다. 긴 컨텍스트는 OpenAI 모델에 의해 구동됩니다. 소수의 도구로 보완되는 기본 모델에 의존하는 많은 AI 모델과 달리 Genie는 독점 프로세스를 통해 개발되었습니다. 모델에 관한 한 Genie는 (현재) GPT-4o의 비보편적 변형을 기반으로 구축되었으며, OpenAI를 통해 Cosine은 실험적 액세스 프로그램의 일부로 이를 훈련할 수 있습니다. 기술 보고서를 통해 연구원들이 Genie 구축을 시작했을 때 16~32k 범위의 상대적으로 짧은 컨텍스트 창 모델만 미세 조정할 수 있었다는 사실을 알게 되었습니다. 이 문제를 해결하기 위해 팀은 이러한 모델에 대한 초기 탐색을 많이 수행하고 1억 개 이상의 토큰으로 구성된 대규모 데이터 세트에서 모델을 교육했습니다. still faces 모델이 주어진 시간 내에 처리할 수 있는 정보량의 한계입니다. 다양한 압축/청킹 방법을 시도한 후 팀에서는 당시에는 사용할 수 있는 모델이 없었음에도 불구하고 더 큰 컨텍스트 모델을 사용하는 것이 유일한 해결책이라고 결정했습니다. 다행히도 얼마 지나지 않아 긴 맥락의 학습을 보장하는 OpenAI 모델이 등장했습니다. Cosine은 블로그 게시물에서 데이터 세트를 구성하는 데 거의 1년을 보냈다고 밝혔습니다. 가장 최근의 훈련 실행에서 Genie는 수십억 개의 토큰 데이터에 대해 훈련을 받았으며 선택된 데이터에는 현재 사용자가 사용하는 프로그래밍 언어가 포함되어 있습니다. 가장 걱정됩니다. 다음은 Genie를 훈련하는 과정에서 다양한 프로그래밍 언어로 된 데이터의 비율입니다. 다음은 버그 수정, 재구성 등 다양한 기능에 대한 데이터의 비율입니다. 라는 측면에서 Pullen에 따르면 Genie 가격은 처음에 두 가지 계층으로 나뉩니다.
- 초보 수준 옵션 가격은 약 $20입니다. 이 레벨에는 개인 및 소규모 팀에 적합한 일부 기능 및 사용 제한이 있습니다.
- 엔터프라이즈 레벨 옵션은 코딩에 능숙한 AI 동료가 있는 것처럼 확장된 기능과 거의 무제한 사용을 제공합니다. 하지만 이 계층의 가격은 더 높아집니다.
Genie의 출시는 소프트웨어 개발 팀, 특히 생산성을 높이고 일상 작업에 소요되는 시간을 줄이려는 팀에 깊은 의미를 갖습니다. 복잡한 프로그래밍 문제를 자율적으로 처리하는 능력을 갖춘 Genie는 엔지니어링 리소스 할당 방식을 변경하여 팀이 보다 전략적인 계획에 집중할 수 있도록 해줍니다. Pullen은 엔지니어링 자원을 더 이상 제한하지 않는 것이 특히 회사를 시작한 이후로 그에게 큰 동기 부여가 되었다고 말했습니다. 그는 알려지지 않은 코드베이스에 빠르게 진입하고, 보이지 않는 문제를 해결할 수 있는 AI 동료의 가치는 분명하고 세상에 큰 영향을 미친다고 믿습니다. 앞으로 회사는 간단한 작업을 위한 소형 모델과 보다 복잡한 과제를 처리할 수 있는 대형 모델을 포함하도록 모델 포트폴리오를 확장할 계획입니다. 또한 Cosine은 작업을 오픈 소스 커뮤니티로 확장할 계획입니다. 이제 일부 사용자가 Genie를 사용할 수 있지만 더 넓은 액세스는 아직 완전히 제공되지 않습니다. 신청주소 : https://cosine.sh/register제안 Genie 스타트업 Cosine by Pullen, Sam Stenner, Yang Li in 창업 2022년의 임무는 인간의 추론을 적용하여 복잡한 문제를 해결함으로써 AI의 경계를 넓히는 것입니다. 분명히 그들의 노력은 소프트웨어 엔지니어링에서 시작됩니다. 그 중 Yang Li는 옥스퍼드 대학교에서 석사 학위를 취득하고 2021년 포브스 유럽 30세 이하 30인에 선정된 중국인입니다. Cosine은 Uphonest와 SOMA Capital로부터 250만 달러의 시드 펀딩을 모금했으며 Lakestar, Focal 등도 참여하고 있습니다. 팀 규모는 작지만 코사인은 이미 AI 분야에서 상당한 진전을 이루었고 지니는 시작에 불과합니다. 풀렌은 발표 기사에서 "우리는 모든 직업과 산업에 대해 인간 수준의 추론 능력을 구축할 수 있다고 굳게 믿습니다"라고 말했습니다.„Software-Engineering ist einfach der intuitivste Ausgangspunkt, wir werden bald alles enthüllen, woran wir arbeiten.“ -considerations-to-help-organizations-implement-an-ai-code-of-conducts/https://cosine.sh/blog/genie-technical-reporthttps : //cosine.sh/blog/state-of-the-art위 내용은 세계에서 가장 강력한 AI 프로그래머: GPT-4o 축복으로 요청을 완료하는 데 84초 밖에 걸리지 않습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!