本地使用Groq Llama 3 70B的逐步指南-人工智能-PHP中文网

Groq LPU推理引擎简介

安装Jan AI

创建Groq Cloud API

在Jan AI中使用Groq

在VSCode中使用Groq

结论

首页

科技周边

人工智能

本地使用Groq Llama 3 70B的逐步指南

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 10, 2024 am 09:16 AM

ai llm 大语言模型

本地使用Groq Llama 3 70B的逐步指南

译者 | 布加迪

审校 | 重楼

本文介绍了如何使用Groq LPU推理引擎在Jan AI和VSCode中生成超快速响应。

本地使用Groq Llama 3 70B的逐步指南

每个人都致力于构建更好的大语言模型（LLM），例如Groq专注于AI的基础设施方面。这些大模型的快速响应是确保这些大模型更快捷地响应的关键。

本教程将介绍Groq LPU解析引擎以及如何在笔记本电脑上使用API和Jan AI本地访问它。本文还将把它整合到VSCode中，以帮助我们生成代码、重构代码、输入文档并生成测试单元。本文将免费创建我们自己的人工智能编程助手。

Groq LPU推理引擎简介

Groq LPU(语言处理单元)推理引擎旨在为拥有顺序组件的计算密集型应用程序(比如LLM)生成快速响应。

与CPU和GPU相比，LPU拥有更强大的算力，这减少了预测单词所需的时间，大大加快了生成文本序列的速度。此外，与GPU相比，LPU还可以处理内存瓶颈，从而在LLM上提供更好的性能。

简而言之，Groq LPU技术使你的LLM超级快速，实现实时AI应用。不妨阅读Groq ISCA 2022论文(https://wow.groq.com/isca-2022-paper/)，以了解关于LPU架构的详细信息。

安装Jan AI

Jan AI是一个桌面应用程序，在本地运行开源和专有的大语言模型。它提供Linux、macOS和Windows版本供人下载。我们将下载Jan AI并安装在Windows中，为此进入到https://github.com/janhq/jan/releases，点击扩展名为“.exe”的文件。

本地使用Groq Llama 3 70B的逐步指南

如果你想在本地使用LLM以增强隐私，请阅读《在笔记本电脑上使用LLM的5种方法》博文(https://www.kdnuggets.com/5-ways-to-use-llms-on-your-laptop)，开始使用最先进的开源语言模型。

创建Groq Cloud API

要在Jan AI中使用Grog Llama 3，我们需要一个API。为此，我们将进入到https://console.groq.com/，创建一个Groq Cloud帐户。

如果你想要测试Groq提供的各种模型，无需任何设置就能做到这一点，只需进入到Playground选项卡，选择模型，并添加用户输入。

在本文这个例子中，它非常快，每秒生成310个token，这是我迄今见过的最快速度。连Azure AI或OpenAI也无法获得这种类型的结果。

本地使用Groq Llama 3 70B的逐步指南

要生成API密钥，点击左侧面板上的“API密钥”按钮，然后点击“创建API密钥”按钮，创建并复制API密钥。

本地使用Groq Llama 3 70B的逐步指南

在Jan AI中使用Groq

在下一步中，我们将把Groq Cloud API密钥粘贴到Jan AI应用程序中。

启动Jan AI应用程序，进入到设置，在扩展部分选择“Groq推理引擎”选项，并添加API密钥。

本地使用Groq Llama 3 70B的逐步指南

然后，返回到线程窗口。在模型部分，在“Remote”部分选择Groq Llama 370B，开始输入提示。

本地使用Groq Llama 3 70B的逐步指南

响应生成的速度太快了，我都跟不上了。

本地使用Groq Llama 3 70B的逐步指南

注意：该API的免费版本有一些限制。请访问https://console.groq.com/settings/limits，了解有关它们的更多信息。

在VSCode中使用Groq

接下来，我们将尝试将相同的API密钥粘贴到CodeGPT VSCode扩展中，并构建自己的免费AI编程助手。

在扩展选项卡中搜索CodeGPT扩展，安装它。

本地使用Groq Llama 3 70B的逐步指南

CodeGPT选项卡将出现，以便你选择模型提供方。

本地使用Groq Llama 3 70B的逐步指南

当你选择Groq作为模型提供方时，它将要求你提供API密钥。只需粘贴相同的API密钥，我们就可以开始了。你甚至可以为CodeGPT生成另一个API密钥。

本地使用Groq Llama 3 70B的逐步指南

现在我们将要求它为蛇游戏编写代码。生成并运行代码只花了10秒钟。

本地使用Groq Llama 3 70B的逐步指南

下面演示了我们的蛇游戏。

本地使用Groq Llama 3 70B的逐步指南

不妨了解五大AI编程助手(https://www.kdnuggets.com/top-5-ai-coding-assistants-you-must-try)，成为AI驱动的开发人员和数据科学家。记住，人工智能旨在帮助我们，而不是取代我们，所以不妨对它持开放的心态，用它来提高代码编写水平。

结论

我们在本教程中了解了Groq推理引擎以及如何使用Jan AI Windows应用程序在本地访问它。最后，我们通过使用CodeGPT VSCode扩展，将其整合到我们的工作流中，这真是太棒了。它实时生成响应，以获得更好的开发体验。

原文标题：Using Groq Llama 3 70B Locally: Step by Step Guide，作者：Abid Ali Awan

链接：https://www.kdnuggets.com/using-groq-llama-3-70b-locally-step-by-step-guide。

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/

以上是本地使用Groq Llama 3 70B的逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1666

CakePHP 教程

1425

Laravel 教程

1327

PHP教程

1273

C# 教程

1252

显示更多

Related knowledge

C 中的chrono库如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono库可以让你更加精确地控制时间和时间间隔，让我们来探讨一下这个库的魅力所在吧。C 的chrono库是标准库的一部分，它提供了一种现代化的方式来处理时间和时间间隔。对于那些曾经饱受time.h和ctime折磨的程序员来说，chrono无疑是一个福音。它不仅提高了代码的可读性和可维护性，还提供了更高的精度和灵活性。让我们从基础开始，chrono库主要包括以下几个关键组件：std::chrono::system_clock：表示系统时钟，用于获取当前时间。std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接内存访问技术，允许硬件设备直接与内存进行数据传输，不需要CPU干预。1)DMA操作高度依赖于硬件设备和驱动程序，实现方式因系统而异。2)直接访问内存可能带来安全风险，需确保代码的正确性和安全性。3)DMA可提高性能，但使用不当可能导致系统性能下降。通过实践和学习，可以掌握DMA的使用技巧，在高速数据传输和实时信号处理等场景中发挥其最大效能。

怎样在C 中处理高DPI显示？ Apr 28, 2025 pm 09:57 PM

在C 中处理高DPI显示可以通过以下步骤实现：1)理解DPI和缩放，使用操作系统API获取DPI信息并调整图形输出；2)处理跨平台兼容性，使用如SDL或Qt的跨平台图形库；3)进行性能优化，通过缓存、硬件加速和动态调整细节级别来提升性能；4)解决常见问题，如模糊文本和界面元素过小，通过正确应用DPI缩放来解决。

C 中的实时操作系统编程是什么？ Apr 28, 2025 pm 10:15 PM

C 在实时操作系统（RTOS）编程中表现出色，提供了高效的执行效率和精确的时间管理。1）C 通过直接操作硬件资源和高效的内存管理满足RTOS的需求。2）利用面向对象特性，C 可以设计灵活的任务调度系统。3）C 支持高效的中断处理，但需避免动态内存分配和异常处理以保证实时性。4）模板编程和内联函数有助于性能优化。5）实际应用中，C 可用于实现高效的日志系统。

给MySQL表添加和删除字段的操作步骤 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，删除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段时，需指定位置以优化查询性能和数据结构；删除字段前需确认操作不可逆；使用在线DDL、备份数据、测试环境和低负载时间段修改表结构是性能优化和最佳实践。

怎样在C 中测量线程性能？ Apr 28, 2025 pm 10:21 PM

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析，步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析，步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能，并优化代码。

量化交易所排行榜2025 数字货币量化交易APP前十名推荐 Apr 30, 2025 pm 07:24 PM

交易所内置量化工具包括：1. Binance（币安）：提供Binance Futures量化模块，低手续费，支持AI辅助交易。2. OKX（欧易）：支持多账户管理和智能订单路由，提供机构级风控。独立量化策略平台有：3. 3Commas：拖拽式策略生成器，适用于多平台对冲套利。4. Quadency：专业级算法策略库，支持自定义风险阈值。5. Pionex：内置16 预设策略，低交易手续费。垂直领域工具包括：6. Cryptohopper：云端量化平台，支持150 技术指标。7. Bitsgap：

deepseek官网是如何实现鼠标滚动事件穿透效果的？ Apr 30, 2025 pm 03:21 PM

如何实现鼠标滚动事件穿透效果？在我们浏览网页时，经常会遇到一些特别的交互设计。比如在deepseek官网上，�...

See all articles

本地使用Groq Llama 3 70B的逐步指南

Groq LPU推理引擎简介

安装Jan AI

创建Groq Cloud API

在Jan AI中使用Groq

在VSCode中使用Groq

结论

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题