Maison Périphériques technologiques IA Comment exécuter Llama 3 localement: un guide complet

Comment exécuter Llama 3 localement: un guide complet

Mar 06, 2025 am 11:05 AM

L'exécution de modèles de grande langue (LLMS) comme Llama 3 Localement offre des avantages importants dans le paysage de l'IA. Étreindre le visage et d'autres plates-formes défendent le déploiement local, permettant un accès modèle privé et ininterrompu. Ce guide explore les avantages de l'exécution LLM locale, démontrant l'utilisation avec GPT4ALL et OLLAMA, le service de modèle, l'intégration VScode et enfin, la construction d'une application AI personnalisée.

Pourquoi le déploiement local Llama 3?

Tout en exigeant une puissance élevée de RAM, de GPU et de traitement, les progrès rendent de plus en plus l'exécution de LLAMA 3. Les principaux avantages comprennent:

  • Accès ininterrompu: Évitez les limites de taux et les perturbations du service.
  • Performances améliorées: Expérience de la génération de réponse plus rapide avec une latence minimale. Même les ordinateurs portables de milieu de gamme atteignent des vitesses autour de 50 jetons par seconde.
  • Sécurité améliorée: Gardez le contrôle total des entrées et des données, en gardant tout local.
  • Économies de coûts: Éliminer les frais d'API et les abonnements.
  • Personnalisation et flexibilité: Finez des modèles avec des hyperparamètres, des jetons d'arrêt et des paramètres avancés.
  • Capacité hors ligne: Utilisez le modèle sans connexion Internet.
  • Propriété et contrôle: conserver la propriété complète du modèle, des données et des sorties.

Pour une plongée plus profonde dans le cloud par rapport à l'utilisation locale de LLM, consultez notre article, "Cloud vs déploiement LLM local: pesant les avantages et les inconvénients."

LLAMA 3 avec GPT4ALL et OLLAMA

GPT4ALL est un outil open source pour exécuter LLMS localement, même sans GPU. Son interface conviviale s'adresse aux utilisateurs techniques et non techniques.

Téléchargez et installez GPT4ALL (instructions Windows disponibles sur la page de téléchargement officielle). Lancez l'application, accédez à la section "Téléchargements", sélectionnez "Llama 3 instruct" et téléchargez. Après le téléchargement, sélectionnez "Llama 3 instruct" dans le menu "Choisissez un modèle". Entrez votre invite et interagissez avec le modèle. L'accélération du GPU (si disponible) accélérera considérablement les réponses.

How to Run Llama 3 Locally: A Complete Guide

Olllama fournit une approche plus simple. Téléchargez et installez Olllama. Ouvrez votre terminal / powerShell et exécutez:

ollama run llama3
Copier après la connexion
Copier après la connexion

(Remarque: le téléchargement du modèle et l'initialisation du chatbot peuvent prendre plusieurs minutes.)

Interagissez avec le chatbot via le terminal. Tapez /bye pour quitter.

How to Run Llama 3 Locally: A Complete Guide

Explorez des outils et des frameworks supplémentaires dans notre guide "7 méthodes simples pour exécuter LLMS localement".

Local Llama 3 Server and API Access

Un serveur local permet l'intégration de Llama 3 dans d'autres applications. Démarrez le serveur avec:

ollama run llama3
Copier après la connexion
Copier après la connexion

Vérifiez l'état du serveur via l'icône du plateau système Olllama (cliquez avec le bouton droit pour afficher les journaux).

How to Run Llama 3 Locally: A Complete Guide

Accédez à l'API à l'aide de curl:

ollama serve
Copier après la connexion

(Curl est originaire de Linux mais fonctionne également dans Windows PowerShell.)

How to Run Llama 3 Locally: A Complete Guide

Alternativement, utilisez le package Ollama Python:

curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    { "role": "user", "content": "What are God Particles?" }
  ],
  "stream": false
}'
Copier après la connexion

How to Run Llama 3 Locally: A Complete Guide

Le package prend en charge les appels asynchrones et le streaming pour une efficacité améliorée.

Intégration VScode avec codegpt

Intégrer Llama 3 dans VSCODE pour des fonctionnalités telles que la complétion automatique et les suggestions de code.

  1. Démarrez le serveur Olllama (ollama serve).
  2. Installez l'extension VScode "CodeGPT".
  3. Configurer CodeGpt, en sélectionnant Olllama comme fournisseur et "LLAMA3: 8B" comme modèle (aucune clé API nécessaire).
  4. Utilisez les invites de CodeGPT pour générer et affiner le code dans vos fichiers Python.

How to Run Llama 3 Locally: A Complete Guide

Voir "Configuration de VScode pour Python" pour la configuration avancée.

Développer une application AI locale

Cette section détaille la création d'une application AI qui traite les fichiers DOCX, génère des intégres, utilise un magasin vectoriel pour la recherche de similitude et fournit des réponses contextuelles aux requêtes utilisateur.

(Des exemples de code détaillés et des explications sont omis pour la concision mais sont disponibles dans l'entrée d'origine.) Le processus implique:

  1. Configuration des packages Python nécessaires.
  2. Chargement des fichiers docx à l'aide de DirectoryLoader.
  3. Fractionnement du texte en morceaux gérables.
  4. Générer des intérêts avec le Llama 3 d'Olllama et les stocker dans un magasin de vecteur de chroma.
  5. Construire une chaîne de Langchain pour la réponse aux questions, incorporant le magasin vectoriel, Rag Invite et Ollama Llm.
  6. Création d'une application de terminal interactive pour interroger le système.

How to Run Llama 3 Locally: A Complete Guide

Le code complet de cette application est disponible sur github (lien fourni dans l'entrée d'origine).

Conclusion

Running Llama 3 Localement, les utilisateurs ont la confidentialité, la rentabilité et le contrôle. Ce guide démontre la puissance des outils et cadres open source pour créer des applications d'IA sophistiquées sans s'appuyer sur les services cloud. Les exemples fournis mettent en valeur la facilité d'intégration avec les environnements de développement populaires et le potentiel de création de solutions AI personnalisées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

Début avec Meta Llama 3.2 - Analytics Vidhya Début avec Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

META'S LLAMA 3.2: un bond en avant dans l'IA multimodal et mobile Meta a récemment dévoilé Llama 3.2, une progression importante de l'IA avec de puissantes capacités de vision et des modèles de texte légers optimisés pour les appareils mobiles. S'appuyer sur le succès o

Meilleurs chatbots AI comparés (Chatgpt, Gemini, Claude & amp; plus) Meilleurs chatbots AI comparés (Chatgpt, Gemini, Claude & amp; plus) Apr 02, 2025 pm 06:09 PM

L'article compare les meilleurs chatbots d'IA comme Chatgpt, Gemini et Claude, en se concentrant sur leurs fonctionnalités uniques, leurs options de personnalisation et leurs performances dans le traitement et la fiabilité du langage naturel.

Assistants d'écriture de l'IA pour augmenter votre création de contenu Assistants d'écriture de l'IA pour augmenter votre création de contenu Apr 02, 2025 pm 06:11 PM

L'article traite des meilleurs assistants d'écriture d'IA comme Grammarly, Jasper, Copy.ai, WireSonic et Rytr, en se concentrant sur leurs fonctionnalités uniques pour la création de contenu. Il soutient que Jasper excelle dans l'optimisation du référencement, tandis que les outils d'IA aident à maintenir le ton

10 extensions de codage générateur AI dans le code vs que vous devez explorer 10 extensions de codage générateur AI dans le code vs que vous devez explorer Apr 13, 2025 am 01:14 AM

Hé là, codant ninja! Quelles tâches liées au codage avez-vous prévues pour la journée? Avant de plonger plus loin dans ce blog, je veux que vous réfléchissiez à tous vos malheurs liés au codage - les énumérez. Fait? - Let & # 8217

AV Bytes: Meta & # 039; S Llama 3.2, Google's Gemini 1.5, et plus AV Bytes: Meta & # 039; S Llama 3.2, Google's Gemini 1.5, et plus Apr 11, 2025 pm 12:01 PM

Le paysage de l'IA de cette semaine: un tourbillon de progrès, de considérations éthiques et de débats réglementaires. Les principaux acteurs comme Openai, Google, Meta et Microsoft ont déclenché un torrent de mises à jour, des nouveaux modèles révolutionnaires aux changements cruciaux de LE

Vendre une stratégie d'IA aux employés: le manifeste du PDG de Shopify Vendre une stratégie d'IA aux employés: le manifeste du PDG de Shopify Apr 10, 2025 am 11:19 AM

La récente note du PDG de Shopify Tobi Lütke déclare hardiment la maîtrise de l'IA une attente fondamentale pour chaque employé, marquant un changement culturel important au sein de l'entreprise. Ce n'est pas une tendance éphémère; C'est un nouveau paradigme opérationnel intégré à P

Choisir le meilleur générateur de voix d'IA: les meilleures options examinées Choisir le meilleur générateur de voix d'IA: les meilleures options examinées Apr 02, 2025 pm 06:12 PM

L'article examine les meilleurs générateurs de voix d'IA comme Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson et Descript, en se concentrant sur leurs fonctionnalités, leur qualité vocale et leur aptitude à différents besoins.

See all articles