了解面部解析-人工智慧-PHP中文網

面部解析：用於面部特徵分析的強大語義分割模型。本文探討了面對解析，這是一種利用語義細分來分析面部特徵的計算機視覺技術。我們將檢查模型的體系結構，使用擁抱面，現實世界應用程序的實現以及常見的問題。

該面部解析模型從NVIDIA的MIT-B5和Celebmask HQ進行了微調，擅長識別和標記各種面部區域和周圍物體。從背景細節到細微的特徵，例如眼睛，鼻子，皮膚，眉毛，衣服和頭髮，模型都提供了全面的像素級分割。

關鍵學習點

在語義分割的框架內掌握面部解析的概念。
了解面部解析的核心原則。
了解如何運行面部解析模型。
探索該模型的實際應用。

本文是數據科學博客馬拉鬆的一部分。

什麼是面部解析？
模型架構
運行面部解析模型
現實世界應用
結論
常見問題

什麼是面部解析？

面部解析是一項計算機視覺任務，細心將面部圖像分為其組成部分。這種像素級分割可以詳細分析和操縱面部特徵和周圍元素。

模型架構

該模型採用基於變壓器的架構進行語義分割，類似於Segformer。關鍵組件包括：

變壓器編碼器：從輸入圖像中提取多尺度特徵，從各種空間尺度上捕獲細節。
MLP解碼器：基於多層感知器的輕量級解碼器，使用局部和全局注意機制有效地結合了編碼器不同層中的信息。當地註意力集中在各個特徵上，而全球關注確保了整體面部結構的準確代表。
沒有位置嵌入：此設計選擇提高了效率和魯棒性，減輕與圖像分辨率相關的問題。

該體系結構平衡了性能和效率，從而產生了一個模型，該模型在不同的面部圖像中有效，同時保持面部區域之間的尖銳邊界。

了解面部解析

如何運行面部解析模型

本節詳細介紹了使用擁抱面推理API和庫來運行模型。

使用擁抱臉推理API

擁抱面API簡化了過程。 API接受圖像並返回面部特徵的顏色編碼分段。

了解面部解析

導入請求

api_url =“ https://api-inference.huggingface.co/models/jonathandinu/face-parsing”
標題= {“授權”：“持有人HF_WMNFRHGZXCZUSXTPMCSSSBTURAKMNIJDOKE”}

DEF查詢（文件名）：
    用開放式（文件名，“ rb”）為f：
        data = f.read（）
    響應= requests.post（api_url，headers =標題，data = data）
    返迴響應json（）

輸出=查詢（“/content/img_20221108_073555.jpg”）
打印（輸出）

登入後複製

使用庫（segformer）

這種方法利用了transformers庫，需要導入必要的模塊。

導入火炬
從火炬進口
從變形金剛導入segformerimageProcessor，segformerForsemanticentation
從PIL導入圖像
導入matplotlib.pyplot作為PLT
導入請求

設備=“ cuda”如果torch.cuda.is_available（）else“ mps”（如果torch.backends.mps.is_available（）else“ cpu”

image_processor = segformerimageProcessor.from_pretrataining（“ jonathandinu/face-parssing”）
型號= segformerForsemanticSegentation.from_pretrataining（“ jonathandinu/face-parsing”）。到（設備）

url =“ https://images.unsplash.com/photo-1539571696357-5A69C17A67C6”
image = image.open（requests.get（url，stream = true）.raw）

輸入= image_processor（images = image，return_tensors =“ pt”）。到（設備）
輸出=模型（**輸入）
logits = outputs.logits

upsampled_logits = nn.functional.interpalle（logits，size = image.size [::  -  1]，mode ='bilinear'，align_corners = false）
labels = upsampled_logits.argmax（dim = 1）[0] .cpu（）。numpy（）
plt.imshow（標籤）
plt.show（）

登入後複製

了解面部解析