使用 .NET Core、Python 和 Azure 微调大型语言模型 (LLM)-Python教程-PHP中文网

用于微调的 Python
- 常用库（例如，Hugging Face Transformers、PyTorch）
- 简化了加载和调整预训练模型的过程
用于集成的 .NET Core C#
- 公开微调模型的后端服务或 API
- 强类型语言，许多企业开发人员都很熟悉
Azure 服务
- Azure 机器学习 用于训练和模型管理
- Azure 存储 用于数据和模型工件
- Azure 应用服务 或 Azure 函数 用于托管 .NET Core 应用程序
- Azure 密钥保管库（可选）用于保护凭据

环境设置

先决条件

Azure 订阅: 需要创建机器学习工作区和应用服务等资源。
Python 3.8 : 在本地安装，用于模型微调。
.NET 6/7/8 SDK: 用于创建和运行 .NET Core C# 应用程序。
Visual Studio 2022 或 Visual Studio Code: 建议使用的 IDE。
Azure CLI: 用于通过终端配置和管理 Azure 服务。
Docker（可选）：如果需要，可用于容器化您的应用程序。

使用 Python 进行训练和微调

此示例使用 Hugging Face Transformers——这是最广泛采用的 LLM 微调库之一。

5.1 设置虚拟环境

<code>python -m venv venv
source venv/bin/activate  # 在 Windows 上：venv\Scripts\activate</code>

登录后复制

5.2 安装依赖项

<code>pip install torch transformers azureml-sdk</code>

登录后复制

5.3 创建 Azure 机器学习工作区

资源组 和 工作区:

<code>   az group create --name LLMFinetuneRG --location eastus
   az ml workspace create --name LLMFinetuneWS --resource-group LLMFinetuneRG</code>

登录后复制

配置本地环境以连接到工作区（使用 config.json 文件或环境变量）。

5.4 微调脚本 (train.py)

<code>import os
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
from azureml.core import Workspace, Run

# 连接到 Azure ML
ws = Workspace.from_config()
run = Run.get_context()

model_name = "gpt2"  # 示例模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 加载自定义数据集（本地或来自 Azure 存储）
# 示例：Azure ML 中的文本文件或数据集
train_texts = ["此处输入您的特定领域文本..."]  # 简化版
train_encodings = tokenizer(train_texts, truncation=True, padding=True)

class CustomDataset(torch.utils.data.Dataset):
    def __init__(self, encodings):
        self.encodings = encodings
    def __len__(self):
        return len(self.encodings["input_ids"])
    def __getitem__(self, idx):
        return {k: torch.tensor(v[idx]) for k, v in self.encodings.items()}

train_dataset = CustomDataset(train_encodings)

training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=2,
    save_steps=100,
    logging_steps=100
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,
)

trainer.train()

# 保存微调后的模型
trainer.save_model("./fine_tuned_model")
tokenizer.save_pretrained("./fine_tuned_model")</code>

登录后复制

5.5 在 Azure 中注册模型

<code>from azureml.core.model import Model

model = Model.register(
    workspace=ws,
    model_path="./fine_tuned_model",
    model_name="myFineTunedLLM"
)</code>

登录后复制

此时，您的微调模型已存储在 Azure 机器学习中，方便访问和版本控制。

在 .NET Core 中集成微调后的模型

6.1 创建 .NET Core Web API 项目

<code>dotnet new webapi -n FineTunedLLMApi
cd FineTunedLLMApi</code>

登录后复制

6.2 添加依赖项

HttpClient 用于调用 Azure 端点或本地推理 API
Newtonsoft.Json（如果您更喜欢使用 JSON.NET 进行序列化）
Azure.Storage.Blobs 或 Azure.Identity 用于安全访问 Azure 资源

<code>dotnet add package Microsoft.Extensions.Http
dotnet add package Microsoft.Azure.Storage.Blob
dotnet add package Newtonsoft.Json</code>

登录后复制

6.3 ModelConsumerService.cs

假设您已将微调后的模型部署为 Web 服务（例如，使用 Azure 容器实例或 Azure ML 中的自定义端点）。以下代码段调用该服务以获取完成结果。

<code>using Newtonsoft.Json;
using System.Net.Http;
using System.Text;
using System.Threading.Tasks;

public class ModelConsumerService
{
    private readonly HttpClient _httpClient;

    public ModelConsumerService(IHttpClientFactory httpClientFactory)
    {
        _httpClient = httpClientFactory.CreateClient("FineTunedModel");
    }

    public async Task<string> GetCompletionAsync(string prompt)
    {
        var requestBody = new { prompt = prompt };
        var content = new StringContent(
            JsonConvert.SerializeObject(requestBody),
            Encoding.UTF8, 
            "application/json");

        var response = await _httpClient.PostAsync("/predict", content);
        response.EnsureSuccessStatusCode();
        return await response.Content.ReadAsStringAsync();
    }
}</code>

登录后复制

6.4 LLMController.cs

<code>using Microsoft.AspNetCore.Mvc;
using System.Threading.Tasks;

[ApiController]
[Route("[controller]")]
public class LLMController : ControllerBase
{
    private readonly ModelConsumerService _modelService;

    public LLMController(ModelConsumerService modelService)
    {
        _modelService = modelService;
    }

    [HttpPost("complete")]
    public async Task<IActionResult> CompletePrompt([FromBody] PromptRequest request)
    {
        var result = await _modelService.GetCompletionAsync(request.Prompt);
        return Ok(new { Completion = result });
    }
}

public class PromptRequest
{
    public string Prompt { get; set; }
}</code>

登录后复制

6.5 配置 .NET Core 应用程序

在 Program.cs 或 Startup.cs 中：

<code>var builder = WebApplication.CreateBuilder(args);

// 注册 HttpClient
builder.Services.AddHttpClient("FineTunedModel", client =>
{
    client.BaseAddress = new Uri("https://your-model-endpoint/");
});

// 注册 ModelConsumerService
builder.Services.AddTransient<ModelConsumerService>();

builder.Services.AddControllers();
var app = builder.Build();

app.MapControllers();
app.Run();</code>

登录后复制

部署到 Azure
Azure 应用服务:
- 对于许多 .NET Core 应用程序来说，这是最简单的途径。
- 从 Azure 门户或通过 CLI 创建新的 Web 应用。

<code>python -m venv venv
source venv/bin/activate  # 在 Windows 上：venv\Scripts\activate</code>

登录后复制

Azure 函数（可选）：
- 如果您的使用是间歇性的或计划性的，则非常适合运行无服务器、事件驱动的逻辑。
Azure Kubernetes 服务 (AKS)（高级）：
- 非常适合大规模部署。
- 使用 Docker 容器化您的应用程序并将其推送到 Azure 容器注册表 (ACR)。

最佳实践
数据隐私: 确保负责任地处理敏感或专有数据，尤其是在模型训练期间。
监控和日志记录: 集成 Azure Application Insights 以监控性能、跟踪使用情况并检测异常。
安全性: 使用 Azure 密钥保管库 来存储密钥（API 密钥、连接字符串）。
模型版本控制: 跟踪 Azure ML 中不同微调版本的模型；如果需要，回滚到旧版本。
提示工程: 完善您的提示以从微调后的模型中获得最佳结果。

结论

使用 Python 和 Azure 机器学习 微调 LLM，然后将它们集成到 .NET Core 应用程序中，使您可以构建强大的特定领域 AI 解决方案。对于寻求利用 Python 的 AI 生态系统和 .NET 的企业功能的组织来说，这种组合是一个极好的选择，所有这些都由 Azure 的可扩展性提供支持。

通过仔细规划安全、数据治理和 DevOps，您可以推出一个满足现实世界需求的生产就绪型解决方案，在强大且易于维护的框架中提供准确的特定领域语言功能。

以上是使用 .NET Core、Python 和 Azure 微调大型语言模型 (LLM)的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1675

CakePHP 教程

1429

Laravel 教程

1333

PHP教程

1278

C# 教程

1257

显示更多

Related knowledge

Python与C：学习曲线和易用性 Apr 19, 2025 am 12:20 AM

Python更易学且易用，C 则更强大但复杂。1.Python语法简洁，适合初学者，动态类型和自动内存管理使其易用，但可能导致运行时错误。2.C 提供低级控制和高级特性，适合高性能应用，但学习门槛高，需手动管理内存和类型安全。

学习Python：2小时的每日学习是否足够？ Apr 18, 2025 am 12:22 AM

每天学习Python两个小时是否足够？这取决于你的目标和学习方法。1)制定清晰的学习计划，2)选择合适的学习资源和方法，3)动手实践和复习巩固，可以在这段时间内逐步掌握Python的基本知识和高级功能。

Python vs.C：探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在开发效率上优于C ，但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

Python vs. C：了解关键差异 Apr 21, 2025 am 12:18 AM

Python和C 各有优势，选择应基于项目需求。1)Python适合快速开发和数据处理，因其简洁语法和动态类型。2)C 适用于高性能和系统编程，因其静态类型和手动内存管理。

Python标准库的哪一部分是：列表或数组？ Apr 27, 2025 am 12:03 AM

pythonlistsarepartofthestAndArdLibrary，herilearRaysarenot.listsarebuilt-In，多功能，和Rused ForStoringCollections，而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。

Python：自动化，脚本和任务管理 Apr 16, 2025 am 12:14 AM

Python在自动化、脚本编写和任务管理中表现出色。1)自动化：通过标准库如os、shutil实现文件备份。2)脚本编写：使用psutil库监控系统资源。3)任务管理：利用schedule库调度任务。Python的易用性和丰富库支持使其在这些领域中成为首选工具。

科学计算的Python：详细的外观 Apr 19, 2025 am 12:15 AM

Python在科学计算中的应用包括数据分析、机器学习、数值模拟和可视化。1.Numpy提供高效的多维数组和数学函数。2.SciPy扩展Numpy功能，提供优化和线性代数工具。3.Pandas用于数据处理和分析。4.Matplotlib用于生成各种图表和可视化结果。

Web开发的Python：关键应用程序 Apr 18, 2025 am 12:20 AM

Python在Web开发中的关键应用包括使用Django和Flask框架、API开发、数据分析与可视化、机器学习与AI、以及性能优化。1.Django和Flask框架：Django适合快速开发复杂应用，Flask适用于小型或高度自定义项目。2.API开发：使用Flask或DjangoRESTFramework构建RESTfulAPI。3.数据分析与可视化：利用Python处理数据并通过Web界面展示。4.机器学习与AI：Python用于构建智能Web应用。5.性能优化：通过异步编程、缓存和代码优

See all articles

使用 .NET Core、Python 和 Azure 微调大型语言模型 (LLM)

目录

引言

为什么微调大型语言模型？

解决方案概述

组件和技术

环境设置

先决条件

使用 Python 进行训练和微调

5.1 设置虚拟环境

5.2 安装依赖项

5.3 创建 Azure 机器学习工作区

5.4 微调脚本 (train.py)

5.5 在 Azure 中注册模型

在 .NET Core 中集成微调后的模型

6.1 创建 .NET Core Web API 项目

6.2 添加依赖项

6.3 ModelConsumerService.cs

6.4 LLMController.cs

6.5 配置 .NET Core 应用程序

部署到 Azure

最佳实践

结论

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题