Um mehr über AIGC zu erfahren, besuchen Sie bitte:
51CTO AI.x Community
https://www.51cto.com/aigc/
In letzter Zeit ersetzen viele Menschen ihre eigene KI-Arbeit und machen sich Sorgen.
Devin, der „erste KI-Programmierer“, der letzten Monat im KI-Kreis populär wurde, beherrscht Full-Stack-Fähigkeiten, indem er die Fähigkeiten großer Modelle nutzt. Er kann komplexe Codeaufgaben automatisch erledigen, indem er nur natürliche Sprache benötigt Anweisungen von Menschen.
Die von Devin demonstrierten Tool-Fähigkeiten sind sehr erstaunlich, insbesondere für dieses Startup-Unternehmen, das den Closed-Source-Weg geht. Derzeit können nur wenige Personen dieses Closed-Beta-Kontingent nutzen.
Am Dienstag veröffentlichten Forscher der Princeton University NLP Group SWE-Agent, einen Open-Source-KI-Programmierer, der in weniger als einem Tag Tausende von GitHub-Sternen erhielt. Dieser SWE-Agent basiert auf Deep-Learning-Technologie und kann automatisch effizienten und zuverlässigen Code schreiben. Seine Veröffentlichung erregte große Aufmerksamkeit und viele Entwickler brachten große Anerkennung für seine Technologie und Leistung zum Ausdruck. Diese Erfolge belegen auch den Fortschritt der KI-Forschung im Bereich NLP
SWE-Agent ist ein neues System zur autonomen Lösung von Problemen in GitHub-Repositories. Es erreichte eine ähnliche Genauigkeit wie Devin auf der SWE-Bank und benötigte durchschnittlich 93 Sekunden. Die John Yang, der Autor des Projekts, sagte, dass am 10. April auch eine Vorabdruckversion des entsprechenden Papiers hochgeladen werde.
Im Prinzip kann der SWE-Agent Fehler und Probleme in echten GitHub-Repositories beheben, indem er große Modelle (wie GPT-4) in Software-Engineering-Agenten umwandelt.
Die Entwickler dieses Projekts haben die Benutzeroberfläche sorgfältig entworfen und auf GitHub eingeführt.
Agent-Computer-Schnittstelle (ACI)
Das Forschungsteam hat ein einfaches, auf große Modelle (LM) ausgerichtetes Befehls- und Feedbackformat entwickelt, um es großen Modellen zu ermöglichen, das Repository einfacher zu durchsuchen, anzuzeigen, zu bearbeiten und auszuführen Codedatei, dies wird als Agent-Computer-Schnittstelle (ACI) bezeichnet. Das Forschungsteam erstellte außerdem ein SWE-Agenten-Repository, um ACI-Designs von codierten Agenten auf Repository-Ebene einfach zu iterieren.
So wie Sprachmodelle eine gute schnelle Entwicklung erfordern, führt ein gutes ACI-Design zu besseren Ergebnissen bei der Verwendung von Agenten. Der Basisagent ohne gut abgestimmte ACI schneidet viel schlechter ab als der SWE-Agent.
SWE-Agent enthält Funktionen, die das Forschungsteam beim Entwurf der Agent-Computer-Schnittstelle als sehr nützlich empfand, darunter:
1. Fügen Sie einen Linter hinzu, der ausgeführt wird, wenn ein Bearbeitungsbefehl ausgegeben wird, sofern die Codesyntax falsch ist, wird der Bearbeitungsbefehl nicht zugelassen.
3. Stellen Sie speziell entwickelte verzeichnisweite Zeichenfolgensuchbefehle für Agenten bereit. Das Forschungsteam fand es wichtig, dass das Tool Übereinstimmungen prägnant auflistet – listen Sie einfach jede Datei auf, die mindestens eine Übereinstimmung aufweist. Die Studie zeigte, dass es für das Modell zu verwirrend wäre, dem Modell mehr Kontext zu jeder Übereinstimmung anzuzeigen.
4. Wenn die Ausgabe des Befehls leer ist, geben Sie eine Meldung zurück: „Ihr Befehl wurde erfolgreich ausgeführt, hat aber keine Ausgabe erzeugt.“
Zukünftig veröffentlichte Artikel werden weitere Informationen enthalten.
Um den SWE-Agenten zu verwenden, müssen Sie zunächst die folgenden Bedingungen festlegen:
1. Installieren Sie Docker und starten Sie Docker lokal;
2. Installieren Sie Miniconda und verwenden Sie conda env create - fenvironment.yml erstellt die Swe-Agent-Umgebung.
5. Erstellen Sie eine Datei „keys.cfg“ im Stammverzeichnis dieses Repositorys und füllen Sie den folgenden Inhalt aus:
OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'
Schritt 2: Bewerten Sie die Pull-Anfrage, um sicherzustellen, dass sie das Problem tatsächlich behebt (derzeit nur für Probleme im SWE-Benchmark verfügbar).
python run.py --model_name gpt4 \--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml
python run.py --model_name gpt4 \--per_instance_cost_limit 2.00 \--config_file ./config/default.yaml
Wenn Sie eine einzige Frage in SWE-Bench ausführen möchten, können Sie-In-instance_filter:
python run.py --model_name gpt4 \--instance_filter marshmallow-code__marshmallow-1359
51CTO AI . x Community
https://www.51cto.com/aigc/Das obige ist der detaillierte Inhalt vonDer Open-Source-KI-Programmierer ist da: GPT-4-Segen, Fähigkeiten vergleichbar mit Devin, 1,4.000 Sterne pro Tag. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!