


Créez un assistant de révision de code IA avec vev, litellm et Agenta
Ce didacticiel montre la création d'un réviseur de demandes d'extraction d'IA prêt pour la production à l'aide des meilleures pratiques LLMOps. L'application finale, accessible ici, accepte une URL de relations publiques publique et renvoie un avis généré par l'IA.
Aperçu de l'application
Ce tutoriel couvre :
- Développement de code : Récupération des différences PR à partir de GitHub et utilisation de LiteLLM pour l'interaction LLM.
- Observabilité : Implémentation d'Agenta pour la surveillance et le débogage des applications.
- Ingénierie des invites : Itération sur les invites et sélection de modèles à l'aide du terrain de jeu d'Agenta.
- Évaluation LLM : Utiliser le LLM en tant que juge pour une évaluation rapide et modèle.
- Déploiement : Déploiement de l'application en tant qu'API et création d'une UI simple avec v0.dev.
Logique de base
Le flux de travail de l'assistant IA est simple : à partir d'une URL PR, il récupère la différence depuis GitHub et la soumet à un LLM pour examen.
Les différences GitHub sont accessibles via :
<code>https://patch-diff.githubusercontent.com/raw/{owner}/{repo}/pull/{pr_number}.diff</code>
Cette fonction Python récupère le différentiel :
def get_pr_diff(pr_url): # ... (Code remains the same) return response.text
LiteLLM facilite les interactions LLM, offrant une interface cohérente entre différents fournisseurs.
prompt_system = """ You are an expert Python developer performing a file-by-file review of a pull request. You have access to the full diff of the file to understand the overall context and structure. However, focus on reviewing only the specific hunk provided. """ prompt_user = """ Here is the diff for the file: {diff} Please provide a critique of the changes made in this file. """ def generate_critique(pr_url: str): diff = get_pr_diff(pr_url) response = litellm.completion( model=config.model, messages=[ {"content": config.system_prompt, "role": "system"}, {"content": config.user_prompt.format(diff=diff), "role": "user"}, ], ) return response.choices[0].message.content
Implémentation de l'observabilité avec Agenta
Agenta améliore l'observabilité, le suivi des entrées, des sorties et du flux de données pour un débogage plus facile.
Initialisez Agenta et configurez les rappels LiteLLM :
import agenta as ag ag.init() litellm.callbacks = [ag.callbacks.litellm_handler()]
Fonctions des instruments avec les décorateurs Agenta :
@ag.instrument() def generate_critique(pr_url: str): # ... (Code remains the same) return response.choices[0].message.content
Définissez la variable d'environnement AGENTA_API_KEY
(obtenue auprès de Agenta) et éventuellement AGENTA_HOST
pour l'auto-hébergement.
Créer un terrain de jeu LLM
La fonctionnalité de flux de travail personnalisé d'Agenta fournit un terrain de jeu de type IDE pour le développement itératif. L'extrait de code suivant illustre la configuration et l'intégration avec Agenta :
from pydantic import BaseModel, Field from typing import Annotated import agenta as ag import litellm from agenta.sdk.assets import supported_llm_models # ... (previous code) class Config(BaseModel): system_prompt: str = prompt_system user_prompt: str = prompt_user model: Annotated[str, ag.MultipleChoice(choices=supported_llm_models)] = Field(default="gpt-3.5-turbo") @ag.route("/", config_schema=Config) @ag.instrument() def generate_critique(pr_url:str): diff = get_pr_diff(pr_url) config = ag.ConfigManager.get_from_route(schema=Config) response = litellm.completion( model=config.model, messages=[ {"content": config.system_prompt, "role": "system"}, {"content": config.user_prompt.format(diff=diff), "role": "user"}, ], ) return response.choices[0].message.content
Servir et évaluer avec Agenta
- Exécutez
agenta init
en spécifiant le nom de l'application et la clé API. - Courez
agenta variant serve app.py
.
Cela rend l'application accessible via le terrain de jeu d'Agenta pour des tests de bout en bout. LLM-as-a-juge est utilisé pour l’évaluation. L'invite de l'évaluateur est :
<code>You are an evaluator grading the quality of a PR review. CRITERIA: ... (criteria remain the same) ANSWER ONLY THE SCORE. DO NOT USE MARKDOWN. DO NOT PROVIDE ANYTHING OTHER THAN THE NUMBER</code>
L'invite utilisateur pour l'évaluateur :
<code>https://patch-diff.githubusercontent.com/raw/{owner}/{repo}/pull/{pr_number}.diff</code>
Déploiement et frontend
Le déploiement s'effectue via l'interface utilisateur d'Agenta :
- Accédez à la page de présentation.
- Cliquez sur les trois points à côté de la variante choisie.
- Sélectionnez « Déployer en production ».
Une interface v0.dev a été utilisée pour la création rapide d'une interface utilisateur.
Prochaines étapes et conclusion
Les améliorations futures incluent un affinement rapide, l'intégration du contexte complet du code et la gestion des différences importantes. Ce didacticiel montre avec succès la création, l'évaluation et le déploiement d'un réviseur de demandes d'extraction d'IA prêt pour la production à l'aide d'Agenta et de LiteLLM.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Python est plus facile à apprendre et à utiliser, tandis que C est plus puissant mais complexe. 1. La syntaxe Python est concise et adaptée aux débutants. Le typage dynamique et la gestion automatique de la mémoire le rendent facile à utiliser, mais peuvent entraîner des erreurs d'exécution. 2.C fournit des fonctionnalités de contrôle de bas niveau et avancées, adaptées aux applications haute performance, mais a un seuil d'apprentissage élevé et nécessite une gestion manuelle de la mémoire et de la sécurité.

Pour maximiser l'efficacité de l'apprentissage de Python dans un temps limité, vous pouvez utiliser les modules DateTime, Time et Schedule de Python. 1. Le module DateTime est utilisé pour enregistrer et planifier le temps d'apprentissage. 2. Le module de temps aide à définir l'étude et le temps de repos. 3. Le module de planification organise automatiquement des tâches d'apprentissage hebdomadaires.

Python est meilleur que C dans l'efficacité du développement, mais C est plus élevé dans les performances d'exécution. 1. La syntaxe concise de Python et les bibliothèques riches améliorent l'efficacité du développement. Les caractéristiques de type compilation et le contrôle du matériel de CC améliorent les performances d'exécution. Lorsque vous faites un choix, vous devez peser la vitesse de développement et l'efficacité de l'exécution en fonction des besoins du projet.

Est-ce suffisant pour apprendre Python pendant deux heures par jour? Cela dépend de vos objectifs et de vos méthodes d'apprentissage. 1) Élaborer un plan d'apprentissage clair, 2) Sélectionnez les ressources et méthodes d'apprentissage appropriées, 3) la pratique et l'examen et la consolidation de la pratique pratique et de l'examen et de la consolidation, et vous pouvez progressivement maîtriser les connaissances de base et les fonctions avancées de Python au cours de cette période.

PythonlistSaReparmentofthestandardLibrary, tandis que les coloccules de colocède, tandis que les colocculations pour la base de la Parlementaire, des coloments de forage polyvalent, tandis que la fonctionnalité de la fonctionnalité nettement adressée.

Python et C ont chacun leurs propres avantages, et le choix doit être basé sur les exigences du projet. 1) Python convient au développement rapide et au traitement des données en raison de sa syntaxe concise et de son typage dynamique. 2) C convient à des performances élevées et à une programmation système en raison de son typage statique et de sa gestion de la mémoire manuelle.

Python excelle dans l'automatisation, les scripts et la gestion des tâches. 1) Automatisation: La sauvegarde du fichier est réalisée via des bibliothèques standard telles que le système d'exploitation et la fermeture. 2) Écriture de script: utilisez la bibliothèque PSUTIL pour surveiller les ressources système. 3) Gestion des tâches: utilisez la bibliothèque de planification pour planifier les tâches. La facilité d'utilisation de Python et la prise en charge de la bibliothèque riche en font l'outil préféré dans ces domaines.

Les applications clés de Python dans le développement Web incluent l'utilisation des cadres Django et Flask, le développement de l'API, l'analyse et la visualisation des données, l'apprentissage automatique et l'IA et l'optimisation des performances. 1. Framework Django et Flask: Django convient au développement rapide d'applications complexes, et Flask convient aux projets petits ou hautement personnalisés. 2. Développement de l'API: Utilisez Flask ou DjangorestFramework pour construire RestulAPI. 3. Analyse et visualisation des données: utilisez Python pour traiter les données et les afficher via l'interface Web. 4. Apprentissage automatique et AI: Python est utilisé pour créer des applications Web intelligentes. 5. Optimisation des performances: optimisée par la programmation, la mise en cache et le code asynchrones
