Menggunakan AI untuk pengekstrakan titik ciri muka boleh meningkatkan kecekapan dan ketepatan anotasi manual dengan ketara. Selain itu, teknologi ini juga boleh digunakan untuk bidang seperti pengecaman muka, anggaran pose, dan pengecaman ekspresi muka. Walau bagaimanapun, ketepatan dan prestasi algoritma pengekstrakan titik ciri muka dipengaruhi oleh banyak faktor, jadi adalah perlu untuk memilih algoritma dan model yang sesuai mengikut senario tertentu dan keperluan untuk mencapai hasil yang terbaik.
Titik ciri muka ialah titik utama pada wajah manusia dan digunakan untuk aplikasi seperti pengecaman muka, anggaran postur dan pengecaman ekspresi muka. Dalam anotasi data, anotasi titik ciri muka adalah tugas biasa, bertujuan untuk membantu algoritma mengenal pasti titik utama pada wajah manusia dengan tepat.
Dalam aplikasi praktikal, titik ciri muka ialah maklumat penting, seperti kening, mata, hidung, mulut dan bahagian lain. Ia termasuk mata ciri berikut:
Kening: 5 mata ciri di sebelah kiri dan kanan, 10 mata ciri secara keseluruhan.
Mata: Terdapat 6 mata ciri untuk setiap mata kiri dan kanan, sejumlah 12 mata ciri.
Hidung: 1 titik ciri di tengah hidung, 5 titik ciri di bahagian kiri dan kanan hidung, sejumlah 11 titik ciri.
Mulut: 1 titik ciri di sudut kiri dan kanan bibir, 1 titik ciri di tengah bibir atas dan bawah, 3 titik ciri di sebelah kiri dan kanan bibir atas dan bawah, jumlah keseluruhan daripada 20 mata ciri.
Bilangan dan lokasi titik ciri di atas mungkin berbeza-beza disebabkan oleh algoritma atau aplikasi yang berbeza, tetapi secara keseluruhannya ia agak hampir.
Dari segi pengekstrakan titik ciri muka, kaedah tradisional memerlukan anotasi manual, yang memerlukan banyak tenaga kerja dan masa, dan kualiti anotasi mungkin berbeza dari setiap orang. orang. Oleh itu, menggunakan AI untuk pengekstrakan automatik adalah kaedah yang lebih cekap dan tepat.
Operasi pengekstrakan titik ciri muka AI biasanya dibahagikan kepada langkah berikut:
1 Penyediaan data: Pertama, anda perlu menyediakan set data wajah beranotasi, termasuk imej dan anotasi titik ciri yang sepadan .
2 Latihan model: Gunakan model pembelajaran mendalam untuk latihan, secara amnya menggunakan rangkaian saraf konvolusi (CNN) untuk pengekstrakan dan pengelasan ciri. Set data latihan termasuk imej input dan koordinat titik ciri output. Semasa melatih model, anda perlu memilih fungsi kehilangan yang sesuai yang biasa digunakan termasuk ralat min kuasa dua (MSE) dan jarak Euclidean. Model latihan memerlukan banyak sumber dan masa pengkomputeran, dan biasanya memerlukan pecutan GPU.
3. Pengujian model: Model terlatih perlu diuji Secara amnya, set data ujian digunakan untuk pengesahan untuk mengira ketepatan, penarikan semula dan penunjuk lain model. Untuk beberapa senario aplikasi masa nyata, penunjuk seperti kelajuan model dan penggunaan memori juga perlu dipertimbangkan.
4 Aplikasi penggunaan: Dalam senario aplikasi sebenar, model terlatih perlu digunakan pada peranti perkakasan yang sesuai, seperti peranti mudah alih, pelayan awan, dsb. Untuk meningkatkan kecekapan dan ketepatan aplikasi, model juga perlu dioptimumkan dan dimampatkan.
1) Kaedah berdasarkan pembelajaran mesin tradisional
terutamanya menggunakan beberapa algoritma pengekstrakan ciri dan pengelas, seperti SIFT, HOG, dsb. Algoritma ini boleh mengekstrak ciri imej dan kemudian menggunakan pengelas untuk pengelasan dan regresi. Kelebihan kaedah ini ialah kelajuan pengiraan adalah pantas, tetapi kelemahannya ialah mungkin terdapat ralat besar untuk bentuk muka dan postur yang berbeza.
2) Kaedah berasaskan pembelajaran mendalam
terutamanya menggunakan rangkaian neural dalam seperti CNN untuk pengekstrakan dan pengelasan ciri. Kelebihan pembelajaran mendalam ialah ia boleh mempelajari ciri kompleks secara automatik dan boleh memproses sejumlah besar data. Kaedah pembelajaran mendalam yang biasa digunakan pada masa ini termasuk ResNet, VGG, MobileNet, dll. Kelebihan kaedah ini adalah ketepatan yang tinggi, tetapi ia memerlukan sejumlah besar data latihan dan sumber pengkomputeran.
3) Kaedah menggabungkan pembelajaran mesin tradisional dan pembelajaran mendalam
terutamanya menggabungkan algoritma pengekstrakan ciri tradisional dan kaedah pembelajaran mendalam. Algoritma pengekstrakan ciri tradisional boleh mengekstrak ciri peringkat rendah imej, manakala pembelajaran mendalam boleh mempelajari ciri peringkat tinggi. Kelebihan kaedah ini adalah ketepatan yang tinggi dan keteguhan yang baik untuk bentuk muka dan postur yang berbeza.
Atas ialah kandungan terperinci Anotasi data titik ciri muka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!