关于NVIDIA NIM-人工智能-PHP中文网

首页

科技周边

人工智能

关于NVIDIA NIM

Christopher Nolan

Apr 08, 2025 am 10:58 AM

革命性的AI推论与Nvidia Nim：深入潜水

人工智能（AI）正在全球改变行业，影响医疗保健，自动驾驶汽车，金融和客户服务。尽管AI模型开发受到了极大的关注，但AI推断（将经过训练的模型都应用于新数据以进行预测），是现实世界影响真正表现出来的。随着AI驱动的应用变得越来越普遍，对高效，可扩展和低延迟推理解决方案的需求飙升。 NVIDIA神经推断微服务（NIM）解决了这一需求。 NIM使开发人员将AI模型部署为微服务，从而简化了大规模推理解决方案的交付。本文探讨了NIM的功能，通过NIM API展示了模型使用情况，并展示了其对AI推断的变革性影响。

关键学习目标：

掌握AI推理及其跨行业应用的重要性。
了解NVIDIA NIM在AI模型部署中的功能和优势。
学会通过NVIDIA NIM API访问和利用预训练的模型。
掌握测量不同AI模型的推理速度的过程。
探索NIM的实际示例，用于文本生成和图像创建。
欣赏NIM的模块化体系结构及其对可扩展AI解决方案的好处。

（本文是数据科学博客马拉松的一部分。）

目录：

什么是NVIDIA NIM？
探索Nvidia Nim的主要特征
访问Nvidia Nim中的型号
用各种模型评估推理速度
稳定扩散3介质：案例研究
常见问题

什么是NVIDIA NIM？

NVIDIA NIM是一个平台，利用微服务来简化现实世界应用中的AI推断。微服务（独立但协作服务）可以创建可扩展的，适应性的系统。通过包装现成的AI模型作为微服务，NIM允许开发人员在没有复杂的基础架构或规模考虑的情况下快速整合这些模型。

NVIDIA NIM的关键特征：

预先训练的AI模型： NIM提供了用于不同任务的预培训模型的库，包括语音识别，自然语言处理（NLP）和计算机视觉。
性能优化： NIM利用NVIDIA的功能强大的GPU和软件优化（如张力），用于低延迟，高通量推断。
模块化设计：开发人员可以组合和自定义微服务以满足特定的推理要求。

探索Nvidia Nim的主要特征：

快速部署的预训练模型： NIM提供了各种预训练的模型，准备立即部署，涵盖各种AI任务。

关于NVIDIA NIM

低延迟推断： NIM在提供快速响应方面表现出色，这对于诸如自主驾驶的实时应用程序至关重要，而自动驾驶，即传感器和相机数据的立即处理至关重要。

访问Nvidia Nim的型号：

访问NVIDIA NIM并使用您的电子邮件地址登录。

关于NVIDIA NIM

选择一个模型并获取您的API密钥。

关于NVIDIA NIM

用各种模型评估推理速度：

本节演示了如何评估不同AI模型的推理速度。响应时间对于实时应用程序至关重要。我们将以推理模型（Llama-3.2-3b-Instruct Preview）为例。

推理模型（Llama-3.2-3b-Instruct）：

此NLP模型处理并响应用户查询。以下代码段（需要openai和python-dotenv库）展示了其使用和措施的推理速度：

来自Openai Import Openai
来自dotenv import load_dotenv
导入操作系统
进口时间
load_dotenv（）

llama_api_key = os.getEnv（'nvidia_api_key'）

客户端= OpenAi（
  base_url =“ https://integrate.api.nvidia.com/v1”，
  api_key = llama_api_key）

user_input =输入（“输入查询：”）

start_time = time.time（）

completion = client.chat.completions.create（
  型号=“元/llama-3.2-3b-instruct”，
  消息= [{{“ cole”：“ user”，“ content”：user_input}]，
  温度= 0.2，
  top_p = 0.7，
  max_tokens = 1024，
  流= true
）

end_time = time.time（）

完成零件：
  如果块。
    打印（块。

response_time = end_time -start_time
print（f“ \ nResponse时间：{response_time}秒”）

登录后复制

关于NVIDIA NIM

稳定扩散3介质：案例研究

稳定的扩散3介质从文本提示中生成图像。以下代码（使用requests库）说明了其用法：

导入请求
导入基础64
来自dotenv import load_dotenv
导入操作系统
进口时间
load_dotenv（）

Invoke_url =“ https://ai.api.nvidia.com/v1/genai/stociateai/stable-diffusion-3-medium”

api_key = os.getEnv（'stable_diffusion_api'）

＃...（其余代码保持不变）

登录后复制

关于NVIDIA NIM