Test des applications LLM : mésaventures dans les SDK moqueurs par rapport aux requêtes HTTP directes-js tutoriel-php.cn

Maison

interface Web

js tutoriel

Test des applications LLM : mésaventures dans les SDK moqueurs par rapport aux requêtes HTTP directes

Barbara Streisand

Dec 04, 2024 am 11:03 AM

Testing LLM Applications: Misadventures in Mocking SDKs vs Direct HTTP Requests

Introduction

Permettez-moi de commencer ce blog en disant que ce n'est pas comme mes autres blogs où j'ai pu parcourir les étapes que j'ai suivies pour accomplir une tâche. Il s'agit plutôt d'une réflexion sur les défis que j'ai rencontrés en essayant d'ajouter des tests à mon projet, gimme_readme, et sur ce que j'ai appris sur les tests d'applications basées sur LLM en cours de route.

Le contexte

Cette semaine, mes camarades de classe de développement Open Source et moi avons été chargés d'ajouter des tests à nos outils de ligne de commande qui intègrent des modèles de langage étendus (LLM). Cela semblait simple au début, mais cela m'a conduit dans un terrier de tests complexes que je n'avais pas anticipés.

Mon parcours de test

L'approche initiale

Lorsque j'ai créé gimme_readme pour la première fois, j'ai ajouté quelques tests de base en utilisant Jest.js. Ces tests étaient assez simples et se concentraient principalement sur :

Vérification des sorties de fonction
Vérification de la gestion des erreurs de base
Test de fonctions utilitaires simples

Bien que ces tests aient fourni une certaine couverture, ils ne testaient pas l'une des parties les plus critiques de ma candidature : les interactions LLM.

Le défi : tester les interactions LLM

En essayant d'ajouter des tests plus complets, j'ai découvert une réalisation intéressante sur la façon dont mon application communique avec les LLM. Au départ, je pensais pouvoir utiliser Nock.js pour simuler les requêtes HTTP adressées à ces modèles de langage. Après tout, c'est pour cela que Nock est excellent : intercepter et se moquer des requêtes HTTP à des fins de test.

Cependant, j'ai découvert que la façon dont j'utilise le LLM me rend difficile l'écriture de tests avec Nock.

Le dilemme SDK vs requêtes HTTP directes

C'est ici que les choses deviennent intéressantes. Mon application utilise des clients SDK officiels fournis par les services LLM tels que Gemini et Groq de Google. Ces SDK agissent comme des couches d'abstraction qui gèrent toutes les communications HTTP en coulisses. Bien que cela rende le code plus propre et plus facile à utiliser en production, cela crée un défi de test intéressant.

Considérez ces deux approches pour implémenter la fonctionnalité LLM :

// Approach 1: Using SDK
const groq = new Groq({ apiKey });
const response = await groq.chat.completions.create({
  messages: [{ role: "user", content: prompt }],
  model: "mixtral-8x7b-32768"
});

// Approach 2: Direct HTTP requests
const response = await fetch('https://api.groq.com/v1/completions', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    messages: [{ role: "user", content: prompt }],
    model: "mixtral-8x7b-32768"
  })
});

Copier après la connexion

L'approche SDK est plus propre et offre une meilleure expérience aux développeurs, mais elle rend les outils de simulation HTTP traditionnels comme Nock moins utiles. Les requêtes HTTP se produisent à l'intérieur du SDK, ce qui les rend plus difficiles à intercepter avec Nock.

Leçons apprises

Envisagez dès le début une stratégie de test : lorsque vous choisissez entre les SDK et les requêtes HTTP directes, réfléchissez à la manière dont vous allez tester la mise en œuvre. Parfois, le code de production « plus propre » peut rendre les tests plus difficiles.
Les tests du SDK nécessitent différents outils : lorsque vous utilisez des SDK, vous devez vous moquer du niveau du SDK plutôt que du niveau HTTP. Cela signifie :
- Se moquer de l'intégralité du client SDK
- Se concentrer sur l'interface du SDK plutôt que sur les requêtes HTTP
- Utiliser les capacités de moquerie du module de Jest au lieu des intercepteurs HTTP
Équilibre entre commodité et testabilité : bien que les SDK offrent une excellente expérience aux développeurs, ils peuvent rendre certaines approches de test plus difficiles. Cela vaut la peine de considérer ce compromis lors de la conception de votre application.

Aller de l'avant

Bien que je n'aie pas encore entièrement résolu mes défis en matière de tests, cette expérience m'a appris de précieuses leçons sur les tests d'applications qui s'appuient sur des services externes via des SDK. À tous ceux qui créent des applications similaires, je recommanderais :

Pensez à la stratégie de test lorsque vous choisissez entre les SDK et les appels directs d'API
Si vous utilisez des SDK, prévoyez de vous moquer au niveau du SDK plutôt qu'au niveau HTTP
Envisagez d'écrire des wrappers fins autour des SDK pour les rendre plus testables
Documenter l'approche de test pour les autres personnes susceptibles de travailler sur le projet

Conclusion

Le test des applications LLM présente des défis uniques, en particulier lorsqu'il s'agit de trouver un équilibre entre les commodités de développement modernes telles que les SDK et la nécessité de tests approfondis. Alors que je travaille toujours à l'amélioration de la couverture des tests pour gimme_readme, cette expérience m'a permis de mieux comprendre comment aborder les tests dans les futurs projets impliquant des services externes et des SDK.

Quelqu'un d'autre a-t-il rencontré des défis similaires lors du test d'applications utilisant les SDK LLM ? J'aimerais entendre parler de vos expériences et de vos solutions dans les commentaires !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

1 Il y a quelques mois By DDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semaines By DDD

Nordhold: Système de fusion, expliqué

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Java

1676

Tutoriel CakePHP

1429

Tutoriel Laravel

1333

Tutoriel PHP

1278

Tutoriel C#

1257

Afficher plus

Related knowledge

Python vs JavaScript: la courbe d'apprentissage et la facilité d'utilisation Apr 16, 2025 am 12:12 AM

Python convient plus aux débutants, avec une courbe d'apprentissage en douceur et une syntaxe concise; JavaScript convient au développement frontal, avec une courbe d'apprentissage abrupte et une syntaxe flexible. 1. La syntaxe Python est intuitive et adaptée à la science des données et au développement back-end. 2. JavaScript est flexible et largement utilisé dans la programmation frontale et côté serveur.

Javascript et le web: fonctionnalité de base et cas d'utilisation Apr 18, 2025 am 12:19 AM

Les principales utilisations de JavaScript dans le développement Web incluent l'interaction client, la vérification du formulaire et la communication asynchrone. 1) Mise à jour du contenu dynamique et interaction utilisateur via les opérations DOM; 2) La vérification du client est effectuée avant que l'utilisateur ne soumette les données pour améliorer l'expérience utilisateur; 3) La communication de rafraîchissement avec le serveur est réalisée via la technologie AJAX.

JavaScript en action: Exemples et projets du monde réel Apr 19, 2025 am 12:13 AM

L'application de JavaScript dans le monde réel comprend un développement frontal et back-end. 1) Afficher les applications frontales en créant une application de liste TODO, impliquant les opérations DOM et le traitement des événements. 2) Construisez RestulAPI via Node.js et Express pour démontrer les applications back-end.

Comprendre le moteur JavaScript: détails de l'implémentation Apr 17, 2025 am 12:05 AM

Comprendre le fonctionnement du moteur JavaScript en interne est important pour les développeurs car il aide à écrire du code plus efficace et à comprendre les goulots d'étranglement des performances et les stratégies d'optimisation. 1) Le flux de travail du moteur comprend trois étapes: analyse, compilation et exécution; 2) Pendant le processus d'exécution, le moteur effectuera une optimisation dynamique, comme le cache en ligne et les classes cachées; 3) Les meilleures pratiques comprennent l'évitement des variables globales, l'optimisation des boucles, l'utilisation de const et de locations et d'éviter une utilisation excessive des fermetures.

Python vs JavaScript: communauté, bibliothèques et ressources Apr 15, 2025 am 12:16 AM

Python et JavaScript ont leurs propres avantages et inconvénients en termes de communauté, de bibliothèques et de ressources. 1) La communauté Python est amicale et adaptée aux débutants, mais les ressources de développement frontal ne sont pas aussi riches que JavaScript. 2) Python est puissant dans les bibliothèques de science des données et d'apprentissage automatique, tandis que JavaScript est meilleur dans les bibliothèques et les cadres de développement frontaux. 3) Les deux ont des ressources d'apprentissage riches, mais Python convient pour commencer par des documents officiels, tandis que JavaScript est meilleur avec MDNWEBDOCS. Le choix doit être basé sur les besoins du projet et les intérêts personnels.

Python vs JavaScript: environnements et outils de développement Apr 26, 2025 am 12:09 AM

Les choix de Python et JavaScript dans les environnements de développement sont importants. 1) L'environnement de développement de Python comprend Pycharm, Jupyternotebook et Anaconda, qui conviennent à la science des données et au prototypage rapide. 2) L'environnement de développement de JavaScript comprend Node.js, VScode et WebPack, qui conviennent au développement frontal et back-end. Le choix des bons outils en fonction des besoins du projet peut améliorer l'efficacité du développement et le taux de réussite du projet.

Le rôle de C / C dans les interprètes et compilateurs JavaScript Apr 20, 2025 am 12:01 AM

C et C jouent un rôle essentiel dans le moteur JavaScript, principalement utilisé pour implémenter des interprètes et des compilateurs JIT. 1) C est utilisé pour analyser le code source JavaScript et générer une arborescence de syntaxe abstraite. 2) C est responsable de la génération et de l'exécution de bytecode. 3) C met en œuvre le compilateur JIT, optimise et compile le code de point chaud à l'exécution et améliore considérablement l'efficacité d'exécution de JavaScript.

Python vs JavaScript: cas d'utilisation et applications comparées Apr 21, 2025 am 12:01 AM

Python est plus adapté à la science et à l'automatisation des données, tandis que JavaScript est plus adapté au développement frontal et complet. 1. Python fonctionne bien dans la science des données et l'apprentissage automatique, en utilisant des bibliothèques telles que Numpy et Pandas pour le traitement et la modélisation des données. 2. Python est concis et efficace dans l'automatisation et les scripts. 3. JavaScript est indispensable dans le développement frontal et est utilisé pour créer des pages Web dynamiques et des applications à une seule page. 4. JavaScript joue un rôle dans le développement back-end via Node.js et prend en charge le développement complet de la pile.

See all articles