얼굴인식 개발 이력 및 일반적으로 사용되는 데이터 세트

WBOY
풀어 주다: 2024-01-23 12:54:05
앞으로
1429명이 탐색했습니다.

얼굴인식 개발 이력 및 일반적으로 사용되는 데이터 세트

얼굴 인식의 초기 단계 - 기계 학습 기반

초기 방법은 주로 컴퓨터 비전 전문가와 협력하여 손으로 만든 특징을 추출하고 전통적인 기계 학습 알고리즘을 사용하여 감지를 위한 효과적인 분류자를 훈련시키는 데 중점을 두었습니다. 그러나 이러한 방법의 한계는 효과적인 기능을 생성하려면 전문가가 필요하고 각 구성 요소를 개별적으로 최적화해야 하므로 전체 탐지 파이프라인이 과소 최적화된다는 것입니다. 이 문제를 해결하기 위해 HOG, SIFT, SURF 및 ACF와 같은 보다 복잡한 기능이 제안되었습니다. 감지의 견고성을 높이기 위해 다양한 보기나 자세에 대해 훈련된 여러 감지기의 조합도 개발되었습니다. 그러나 이러한 모델은 훈련 및 테스트 시간이 길고 탐지 성능 향상이 제한적입니다.

얼굴 인식을 위한 더욱 발전된 기술 - 딥 러닝 기반

최근 몇 년간 얼굴 인식에 대한 연구, 특히 심층 합성곱 신경망(CNN) 적용 분야에서 상당한 진전이 있었습니다. 딥 러닝 방법은 컴퓨터 비전 작업에서 놀라운 성공을 거두었으며 기존 방법에 비해 많은 장점을 가지고 있습니다. 딥 러닝 방법은 수작업으로 제작된 설계 파이프라인을 피하여 모델을 더욱 유연하게 만들고 다양한 데이터 세트에 적응할 수 있게 해줍니다. 또한 딥 러닝 방법은 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)와 같은 많은 벤치마크 평가에서 좋은 성능을 보였습니다. 이러한 발전으로 얼굴 인식은 보안 감시부터 얼굴 잠금 해제까지 다양한 분야에서 널리 사용될 수 있게 되었습니다.

최근 연구자들은 고급 객체 탐지기인 Faster R-CNN을 적용하여 일반 객체 탐지 ​​분야에서 흥미로운 진전을 이루었습니다. 연구진은 CNN 캐스케이드, RPN(지역 제안 네트워크) 및 Faster R-CNN의 공동 훈련을 결합하여 엔드투엔드 최적화를 달성하고 고무적인 결과를 얻었습니다. 얼굴 감지 측면에서 Faster R-CNN 알고리즘은 하드 네거티브 마이닝 및 ResNet과 결합되어 FDDB와 같은 얼굴 감지 벤치마크의 성능을 크게 향상시킵니다. 이러한 결합된 접근 방식은 얼굴 감지 알고리즘을 더욱 정확하고 안정적으로 만듭니다. 즉, Faster R-CNN과 관련 공동 훈련 및 조합 알고리즘은 객체 감지 및 얼굴 감지 분야에 상당한 진전을 가져왔고 딥러닝 기술 개발의 새로운 방향을 열었습니다.

얼굴 인식에 일반적으로 사용되는 데이터 세트

AFW 데이터 세트: AFW 데이터 세트는 Flickr 이미지를 사용하여 구축되었습니다. 여기에는 205개의 이미지와 473개의 라벨이 지정된 얼굴이 포함되어 있습니다. 각 얼굴에 대한 이미지 주석에는 직사각형 경계 상자, 6개의 랜드마크 및 포즈 각도가 포함됩니다.

PASCAL FACE 데이터 세트: 이 데이터 세트는 얼굴 인식 및 얼굴 식별에 사용됩니다. 이는 PASCAL VOC의 하위 세트이며 큰 얼굴 모양과 포즈 변형을 갖춘 851개의 이미지에 1335개의 라벨이 붙은 얼굴을 포함합니다.

MIT CBCL 얼굴 데이터베이스: MIT-CBCL 얼굴 인식 데이터베이스에는 훈련 세트(얼굴 2429개, 얼굴 없음 4548개)와 추정 세트(얼굴 472개, 얼굴 없음 23573개)가 포함되어 있습니다.

FDDB 데이터세트: 이 데이터세트에는 2,845개의 이미지에 폐색, 어려운 포즈, 낮은 이미지 해상도 등의 주석이 포함된 5,171개의 얼굴이 포함되어 있습니다. 이러한 이미지는 제약이 없는 실제 시나리오에서 얼굴을 감지할 때 흔히 발생하는 큰 모양 변형, 심각한 폐색 및 심각한 흐림 저하에 대한 교육에 사용됩니다.

CMU PIE 데이터베이스: CMU Multi-PIE 얼굴 데이터베이스에는 각 사람의 13가지 포즈, 43가지 조명 조건, 4가지 표정의 68명 이미지 41,368개가 포함되어 있습니다.

SCface 데이터 세트: SCface는 얼굴 정적 이미지 데이터베이스입니다. 이미지는 통제되지 않은 실내 환경에서 다양한 품질의 비디오 감시 카메라 5대를 사용하여 캡처되었습니다. 이 데이터 세트에는 130명의 대상에 대한 4160개의 정적 이미지(가시 및 적외선 스펙트럼)가 포함되어 있습니다.

WIDER FACE 데이터세트: 얼굴 감지 벤치마크 데이터세트에는 32,203개의 이미지와 393,703개의 라벨이 붙은 얼굴이 포함되어 있습니다. 얼굴의 크기, 포즈, 폐색이 매우 다양하므로 얼굴 감지가 매우 까다롭습니다. 또한 WIDER FACE 데이터 세트는 61개의 이벤트 카테고리에 따라 구성됩니다.

위 내용은 얼굴인식 개발 이력 및 일반적으로 사용되는 데이터 세트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:163.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿