如何在本地运行Llama 3：完整的指南-人工智能-PHP中文网

首页

科技周边

人工智能

如何在本地运行Llama 3：完整的指南

Joseph Gordon-Levitt

Mar 06, 2025 am 11:05 AM

>像Llama 3这样的大型语言模型（LLMS）本地在AI景观中提供了显着优势。拥抱面孔和其他平台拥护本地部署，使私人和不间断的模型访问能够访问。本指南探讨了本地LLM执行的好处，证明了使用GPT4ALL和OLLAMA，模型服务，VSCODE集成的使用，最后是构建自定义AI应用程序。

为什么要本地Llama 3部署？在要求高RAM，GPU和处理能力的同时，进步使本地骆驼3执行越来越可行。关键好处包括：

>不间断的访问：

避免速率限制和服务中断。

提高了性能：经验最小的响应生成速度最小。即使是中档笔记本电脑也达到每秒50个令牌的速度。
增强的安全性：保持对输入和数据的完全控制，使所有内容保持本地。
消除API费用和订阅。>
带有超参数，停止令牌和高级设置的微调模型。
>使用没有Internet连接的模型。
保留模型，数据和输出的完全所有权。更深入地研究云与本地LLM的使用情况，请参阅我们的文章“云与本地LLM部署：权衡利弊”。
> llama 3与gpt4all和ollama

> gpt4All是一个开源工具，即使没有GPU，也可以在本地运行LLMS。其用户友好的接口都适合技术和非技术用户。

>下载并安装GPT4All（在官方下载页面上可用Windows说明）。启动应用程序，导航到“下载”部分，选择“ Llama 3指令”，然后下载。下载后，从“选择模型”菜单中选择“ Llama 3指示”。输入您的提示并与模型进行交互。 GPU加速度（如果有）将大大加快响应。

olla提供了一种更简单的方法。下载并安装Ollama。打开您的终端/powershell并执行：

（注意：模型下载和聊天机器人的初始化可能需要几分钟。）>

>通过终端与聊天机器人进行交互。键入

出口。 How to Run Llama 3 Locally: A Complete Guide

ollama run llama3

登录后复制

>在我们的“ 7种用于本地运行LLMS的简单方法”指南中探索其他工具和框架。

>本地Llama 3服务器和API访问/bye

>本地服务器可以将Llama 3集成到其他应用程序中。使用以下方式启动服务器

ollama run llama3

登录后复制

>通过Ollama系统托盘图标检查服务器状态（右键单击以查看日志）。

How to Run Llama 3 Locally: A Complete Guide

>使用卷曲：

访问API

ollama serve

登录后复制

（Curl是Linux的原生，但也可以在Windows PowerShell中起作用。

或者，使用Ollama Python软件包： How to Run Llama 3 Locally: A Complete Guide

curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    { "role": "user", "content": "What are God Particles?" }
  ],
  "stream": false
}'

登录后复制

>包装支持异步调用和流式传输以提高效率。

> How to Run Llama 3 Locally: A Complete Guide

> vscode与Codegpt

集成

将千层面的3集成到VSCODE中，以获取诸如自动完成和代码建议之类的功能。

启动Ollama Server（

）。

ollama serve>配置Codegpt，选择Ollama作为提供商，而“ Llama3：8b”作为模型（无需API密钥）。

开发本地AI应用程序 How to Run Llama 3 Locally: A Complete Guide

本节详细介绍了创建一个处理DOCX文件，生成嵌入式，利用矢量存储的AI应用程序进行相似性搜索，并为用户查询提供上下文答案。

（详细的代码示例和说明是简洁的，但在原始输入中可用。）>该过程涉及：>

设置必要的python软件包。

>使用加载DOCX文件 将文本分成可管理的块。

>建立一个兰链链，以回答问题，并入矢量商店，抹布提示和ollama llm。
创建用于查询系统的交互式终端应用程序。 DirectoryLoader
此应用程序的完整代码可在GitHub上获得（原始输入中提供的链接）。
结论
>运行Llama 3本地赋予用户具有隐私，成本效益和控制权。本指南展示了开源工具和框架的力量，用于构建复杂的AI应用程序而不依赖云服务。提供的示例展示了与流行开发环境的易于集成以及创建自定义AI解决方案的潜力。

以上是如何在本地运行Llama 3：完整的指南的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn