Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen

WBOY
Freigeben: 2024-08-14 13:38:32
Original
506 Leute haben es durchsucht
Alle stehen auf der Warteliste.

Große Modelle schreiten schnell auf dem Weg voran, „menschliche Programmierer zu ersetzen“.

Im März dieses Jahres brachte der Softwareentwickler für künstliche Intelligenz, Devin, die KI-Community in Schwung. Das Produkt basiert auf dem GPT-4 Basic Large Language Model (LLM) von OpenAI und kann nach Erhalt von Textanweisungen in natürlicher Sprache selbstständig schreiben und bearbeiten .Code.

Aber im Bereich der generativen KI ist die schnelle Entwicklung das Hauptthema, und jetzt iteriert die Technologie erneut.

Diese Woche kündigte ein von Y Combinator unterstütztes Startup namens Cosine die Einführung seines eigenen neuen autonomen KI-Ingenieurs Genie an. Das Unternehmen gab an, dass Genie Devin deutlich übertraf und beim Drittanbieter-Benchmark SWE-Bench 30 % erreichte, während Devin nur 13,8 % erreichte.

Das neue Tool übertrifft sogar Amazons Q und Factorys Code Droid um 19 % und ist nun der leistungsstärkste KI-Programmierer der Welt. Die Leistung von W Genie beim SWE-Bench-Benchmark und Vergleich mit anderen AI-Codemodellen.
Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen
„Dieses Modell ist viel mehr als ein Maßstab: Es wurde von Grund auf mit dem Ziel trainiert, wie ein menschlicher SWE (Software Engineer) zu denken und zu handeln“, Mitbegründer und CEO von Cosine Alistair Pullen sagte.

Genie, der Fehler beheben und Code schreiben kann
Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen
Als fortschrittliches KI-Software-Engineering-Modell kann Genie verschiedene Codierungsaufgaben gemäß den Anweisungen menschlicher Ingenieure autonom erledigen, einschließlich Fehlerbehebungen und Funktionen. Erstellen, Code-Refactoring, Code-Tests usw.

Genie kann völlig autonom laufen oder mit Benutzern zusammenarbeiten, um Aufgaben zu erledigen.

Es unterstützt mehrere Programmiersprachen, wie im technischen Bericht gezeigt, einschließlich JavaScript, Python, TypeScript, TSX, Java, C#, C++, C, Rust, Scala, Kotlin, Swift, Golang, PHP, Ruby.

Cosine behauptet, dass Genie die kognitiven Prozesse menschlicher Ingenieure simulieren kann. „Lassen Sie es beobachten, wie menschliche Ingenieure arbeiten, und den Prozess nachahmen“, sagte Alistair Pullen.

Sicherheitsprobleme waren schon immer ein Problem für alle. Der von Genie generierte Code wird im GitHub-Repository des Benutzers gespeichert, sodass Cosine keine Kopie des Codes behält und so die damit verbundenen Sicherheitsrisiken vermeidet.

Darüber hinaus verfügt die Softwareplattform von Cosine über integrierte Slack- und Systembenachrichtigungen, die wie ein KI-Kollege Benutzer an den Status oder die Kennzeichnung von Problemen erinnern.

Alistair Pullen zeigt, wie man Genie nutzt, um reale Probleme zu lösen. Das Ziel ist ein Problem auf GitHub. Wir müssen nur den Link direkt darin einfügen, und die KI analysiert automatisch das Problem und beginnt darüber nachzudenken, welche Dateien zur Lösung des Problems benötigt werden, bis die Anforderungen erfüllt sind.

Anschließend versucht Genie, das Problem in viele Lösungsschritte zu zerlegen und generiert dann Code.

Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließenDer nächste Schritt besteht darin, den Code auszuführen. Wenn es ein Problem mit dem generierten Code gibt, wird das Problem automatisch gefunden, analysiert, geändert und dann versucht, es erneut auszuführen.

Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließenEndgültige Ausgabeergebnisse: zwei Dateien, 17 Tests, nur 84 Sekunden.

Ich weiß nicht, wie oft schneller als menschliche Programmierer.

Der lange Kontext basiert auf OpenAI-Modellen.

Im Gegensatz zu vielen KI-Modellen, die auf Basismodellen basieren, die durch eine Handvoll Tools ergänzt werden, wird Genie durch einen proprietären Prozess entwickelt.

Was die Modelle betrifft, basiert Genie auf einer (derzeit) nicht-universellen Variante von GPT-4o, die OpenAI Cosine im Rahmen des Experimental Access Program trainieren lässt.

Aus dem technischen Bericht haben wir erfahren, dass die Forscher, als sie mit der Entwicklung von Genie begannen, nur ein relativ kurzes Kontextfenstermodell im Bereich von 16-32k verfeinern konnten.

Um dieses Problem zu lösen, führte das Team viele frühe Untersuchungen dieser Modelle durch und trainierte sie anhand eines großen Datensatzes von mehr als 100 Millionen Token. Obwohl festgestellt wurde, dass die Architektur bestimmte Vorteile hat Es gibt immer noch eine Grenze für die Menge an Informationen, die ein Modell in einer bestimmten Zeit verarbeiten kann.

Nachdem das Team verschiedene Komprimierungs-/Chunking-Methoden ausprobiert hatte, entschied das Team, dass die einzige Lösung darin bestand, ein größeres Kontextmodell zu verwenden, obwohl zu diesem Zeitpunkt noch kein Modell verfügbar war.

Glücklicherweise erschienen nicht lange danach OpenAI-Modelle, die das Training langer Kontexte gewährleisteten.

Cosine sagte in seinem Blogbeitrag, dass sie fast ein Jahr damit verbracht haben, den Datensatz zu organisieren. Im letzten Trainingslauf wurde Genie mit Milliarden von Token-Daten trainiert und die ausgewählten Daten umfassten die Programmiersprache, mit der Benutzer derzeit arbeiten am meisten besorgt. Das Folgende ist der Anteil der Daten in verschiedenen Programmiersprachen beim Trainieren von Genie:
Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen
Das Folgende ist der Anteil der Daten für verschiedene Funktionen wie Fehlerreparatur und -rekonstruktion:
Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen
In Bezug auf Laut Pullen wird der Genie-Preis zunächst in zwei Stufen unterteilt:

  • Einstiegsoption zum Preis von etwa 20 US-Dollar. Auf dieser Ebene gibt es einige Funktionen und Nutzungsbeschränkungen, die für Einzelpersonen und kleine Teams geeignet sind.
  • Optionen auf Unternehmensebene bieten erweiterte Funktionen und eine nahezu unbegrenzte Nutzung, genau wie ein KI-Kollege, der sich mit dem Programmieren auskennt. Die Preise auf dieser Stufe werden jedoch höher sein.

Die Einführung von Genie hat tiefgreifende Auswirkungen auf Softwareentwicklungsteams, insbesondere auf diejenigen, die ihre Produktivität steigern und den Zeitaufwand für tägliche Aufgaben reduzieren möchten. Mit seiner Fähigkeit, komplexe Programmierherausforderungen autonom zu bewältigen, kann Genie die Zuweisung von technischen Ressourcen verändern und es Teams ermöglichen, sich auf strategischere Initiativen zu konzentrieren.

Pullen sagte, dass die Tatsache, dass technische Ressourcen keine Einschränkung mehr darstellten, eine große Motivation für ihn sei, insbesondere seit der Gründung des Unternehmens. Er glaubt, dass der Wert eines KI-Kollegen, der schnell in unbekannte Codebasen einsteigen und unsichtbare Probleme lösen kann, offensichtlich ist und einen enormen Einfluss auf die Welt hat.

Zukünftig beabsichtigt das Unternehmen, sein Modellportfolio um kleinere Modelle für einfache Aufgaben und größere Modelle für komplexere Herausforderungen zu erweitern. Darüber hinaus plant Cosine, seine Arbeit auf die Open-Source-Community auszuweiten.

Genie ist jetzt für einige Benutzer verfügbar, ein breiterer Zugriff ist jedoch noch nicht vollständig verfügbar.

Bewerbungsadresse: https://cosine.sh/register

Gründungsteam: nur fünf Personen

Vorgeschlagenes Genie-Startup Cosine von Pullen, Sam Stenner und Yang Li. Gegründet im Jahr 2022 , seine Mission ist es, die Grenzen der KI zu erweitern, indem es menschliches Denken zur Lösung komplexer Probleme anwendet. Ihre Bemühungen beginnen eindeutig mit der Softwareentwicklung.
Der leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen
Unter ihnen ist Yang Li ein Chinese, der einen Master-Abschluss an der Universität Oxford gemacht hat und 2021 in die Forbes-Liste der 30 unter 30 Europäer aufgenommen wurde.

Cosine hat eine Startfinanzierung in Höhe von 2,5 Millionen US-Dollar von Uphonest und SOMA Capital erhalten, an der sich auch Lakestar, Focal und andere beteiligt haben.

Das Team mag zwar klein sein, aber Cosine hat im Bereich KI bereits erhebliche Fortschritte gemacht und Genie ist erst der Anfang.

„Wir sind fest davon überzeugt, dass wir für jeden Job und jede Branche menschliche Denkfähigkeiten aufbauen können“, sagte Pullen im Ankündigungsartikel."Software engineering is just the most intuitive starting point, we will soon reveal everything else we are working on."

Reference content:
https://venturebeat.com/ai/ 4-considerations-to-help-organizations-implement-an-ai-code-of-conducts/
https://cosine.sh/blog/genie-technical-report
https ://cosine.sh/blog/state-of-the-art

Das obige ist der detaillierte Inhalt vonDer leistungsstärkste KI-Programmierer der Welt: Mit GPT-4o-Segen dauert es nur 84 Sekunden, um die Anfrage abzuschließen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:jiqizhixin.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage