유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

WBOY
풀어 주다: 2023-05-16 15:37:06
앞으로
1861명이 탐색했습니다.

1. 소개

CV라고도 불리는 컴퓨터 비전(Computer Vision)은 컴퓨터가 사진이나 동영상의 내용을 이해할 수 있게 하는 등 컴퓨터가 이미지를 "보고" "이해"할 수 있도록 돕는 기술을 사용하는 연구 분야입니다. .

이 기사에서는 컴퓨터 비전에 대한 전반적인 소개를 제공합니다. 이 기사는 다음과 같은 6개 부분으로 구성되어 있습니다.

  • 컴퓨터 비전이 중요한 이유
  • 컴퓨터 비전이란 무엇입니까?
  • 컴퓨터 비전의 기본 원리
  • 컴퓨터 비전의 일반적인 작업
  • 일상 생활에서 컴퓨터 비전의 응용 시나리오
  • 컴퓨터 비전이 직면한 과제

2. 컴퓨터 비전이 중요한 이유

생리학적으로 시각의 생성은 시각 기관의 감각 세포의 흥분에서 시작되고 시각 신경계는 나중에 형성된 정보를 처리합니다. 우리 인간은 눈앞에 있는 사물의 모양과 상태를 직관적으로 이해하기 위해 비전을 사용합니다. 우리 대부분은 요리를 완료하고, 장애물을 극복하고, 거리 표지판을 읽고, 비디오를 보는 등 수많은 작업을 수행하기 위해 비전에 의존합니다. 실제로 시각 장애인과 같은 특별한 집단이 아니었다면 대다수의 사람들은 시각을 통해 외부 정보를 얻으며 이 비율은 80%에 달합니다. 유명한 실험 심리학자 Treicher에 따르면 이 비율은 근거 없는 것이 아닙니다. 인간이 얻는 정보의 83%는 시각에서, 11%는 청각에서, 나머지 6%는 후각, 촉각, 미각에서 나온다는 사실이 수많은 실험을 통해 확인됐다. 그러므로 인간에게 있어서 시각은 의심할 바 없이 가장 중요한 감각이다.

인간은 "시각적 동물"일 뿐만 아니라 대부분의 동물에게 시력도 매우 중요한 역할을 합니다. 인간과 동물은 시각을 통해 외부 사물의 크기, 명암, 색, 움직임을 인지하고, 이 정보를 통해 신체의 생존에 중요한 다양한 정보를 획득하며, 주변 세계가 어떤지 학습할 수 있다. 세상과 소통하는 방법.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

컴퓨터 비전이 출현하기 전에는 컴퓨터의 이미지는 블랙박스 상태였습니다. 컴퓨터에서 이미지는 단지 파일이거나 데이터 문자열일 뿐입니다. 컴퓨터는 사진의 내용이 무엇인지 알지 못하고 사진의 크기, 메모리 용량, 형식 등만 알 수 있습니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

컴퓨터와 인공지능이 현실 세계에서 중요한 역할을 하려면 그림을 이해해야 합니다! 따라서 반세기 동안 컴퓨터 과학자들은 컴퓨터가 볼 수 있도록 하는 방법을 찾으려고 노력해 왔으며, 이로 인해 "컴퓨터 비전"이라는 분야가 탄생했습니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

인터넷의 급속한 발전으로 인해 컴퓨터 비전도 특히 중요해졌습니다. 아래 그림은 2020년 이후 네트워크의 새로운 데이터 양에 대한 추세 차트입니다. 회색 그래픽은 구조화된 데이터이고 파란색 그래픽은 구조화되지 않은 데이터(주로 사진 및 비디오)입니다. 사진과 비디오의 수가 기하급수적으로 증가하고 있다는 것은 분명합니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

인터넷은 텍스트와 이미지로 구성되어 있습니다. 텍스트 검색은 비교적 간단하지만 이미지를 검색하려면 알고리즘이 이미지에 포함된 내용을 알아야 합니다. 오랫동안 인간에게는 이미지와 비디오의 내용을 이해할 만큼 충분한 기술이 없었으며 수동 주석에만 의존하여 이미지나 비디오에 대한 설명을 얻을 수 있었습니다. 컴퓨터가 이러한 이미지 정보를 더 잘 이해할 수 있도록 하는 방법은 오늘날 컴퓨터 기술이 직면한 주요 과제입니다. 이미지나 비디오 데이터를 최대한 활용하려면 컴퓨터가 이미지나 비디오를 "보고" 내용을 이해할 수 있도록 해야 합니다.

3. 컴퓨터 비전이란 무엇인가요?

컴퓨터 비전은 간단히 말해서 컴퓨터가 이미지나 동영상의 내용을 이해할 수 있도록 하는 것입니다. 예: 사진 속 애완동물은 고양이인가요, 개인가요? 사진 속 인물은 장라오인가, 왕라오인가? 영상 속 사람들은 무엇을 하고 있나요? 또한, 컴퓨터 비전은 인간의 눈 대신 카메라와 컴퓨터를 사용하여 대상을 식별, 추적 및 측정하고 그래픽 처리를 수행하여 인간의 눈 관찰 또는 탐지를 위한 장비로 전송하는 데 더 적합한 이미지를 얻는 것을 의미합니다. 컴퓨터 비전은 과학 분야로서 관련 이론과 기술을 연구하며, 이미지나 다차원 데이터로부터 높은 수준의 정보를 얻을 수 있는 인공지능 시스템을 구축하려고 노력하고 있습니다. 엔지니어링 관점에서 자동화 시스템을 활용하여 인간의 시각 시스템을 모방하여 작업을 완료하려고 합니다. 컴퓨터 비전의 궁극적인 목표는 컴퓨터도 인간처럼 시각을 통해 세상을 관찰하고 이해하며, 자율적으로 환경에 적응할 수 있는 능력을 갖게 하는 것입니다. 그러나 컴퓨터가 카메라를 통해 세상을 인식할 수 있다는 사실을 진정으로 깨닫는 것은 매우 어렵습니다. 카메라에 포착된 이미지는 우리가 일반적으로 보는 이미지와 동일하지만 컴퓨터의 경우 모든 이미지는 픽셀의 배열과 조합일 뿐이기 때문입니다. 값. 컴퓨터가 이러한 엄격한 숫자로부터 의미 있는 시각적 단서를 읽을 수 있도록 하는 방법은 컴퓨터 비전이 해결해야 할 문제입니다.

4. 컴퓨터 비전의 기본 원리

카메라나 휴대폰을 사용해 본 사람이라면 누구나 컴퓨터가 놀라운 충실도와 디테일로 사진을 찍는 데 능숙하다는 사실을 어느 정도는 알 수 있습니다. 인간은 태어날 때부터 시각 능력이 훨씬 강합니다. 그러나 우리가 일반적으로 "듣는다는 것이 이해하는 것을 의미하지 않는다"고 말하듯이, "보는 것"은 "이해하는 것"을 의미하지 않습니다. 컴퓨터가 이미지를 진정으로 "이해"하기를 원한다면 이는 간단한 문제가 아닙니다. 이미지는 픽셀의 큰 격자이며 각 픽셀에는 빨간색, 녹색, 파란색의 세 가지 기본 색상이 조합된 색상이 있습니다. RGB 값이라고 하는 세 가지 색상의 강도를 결합하면 어떤 색상이든 얻을 수 있습니다. 시작하기 위한 가장 간단하고 적합한 컴퓨터 비전 알고리즘은 분홍색 공과 같은 색상이 있는 물체를 추적하기 위해 먼저 공의 색상을 기록하고 중앙 픽셀의 RGB 값을 저장한 다음 이미지를 프로그램을 실행하면 프로그램이 이 색상에 가장 가까운 픽셀을 찾을 수 있습니다. 알고리즘은 왼쪽 상단부터 시작하여 각 픽셀을 검사하고 대상 색상과의 차이를 계산할 수 있습니다. 각 픽셀을 확인한 후 가장 가까운 픽셀 부분은 공이 있는 픽셀일 가능성이 높습니다. 이 알고리즘은 이 단일 이미지에서만 실행되는 데 국한되지 않고 비디오의 각 프레임에서 알고리즘을 실행하여 공의 위치를 ​​추적할 수 있습니다. 물론 빛, 그림자 및 기타 요인의 영향으로 인해 공의 색상이 우리가 저장한 RGB 값과 정확히 동일하지는 않지만 매우 가깝습니다. 그러나 야간 축구 경기와 같은 일부 극단적인 경우에는 추적 효과가 매우 낮을 수 있으며, 팀의 유니폼 중 하나가 공과 동일한 색상인 경우 알고리즘이 완전히 "기절"합니다. 따라서 환경을 엄격하게 제어할 수 없는 한 이러한 색상 추적 알고리즘은 실제로 사용되는 경우가 거의 없습니다. 요즘에는 일반적으로 "Deep Learning" 방법과 기술을 사용하는 컴퓨터 비전 알고리즘이 더 많아지고 있으며, 그 중 CNN(Convolutional Neural Network)이 뛰어난 성능으로 인해 가장 널리 사용되고 있습니다. "딥 러닝"에 관련된 지식은 너무 광범위하므로 이 기사에서는 이에 대해 더 자세히 설명하지 않습니다. "딥 러닝"에 대해 자세히 알아보려면 AI 입문 과정인 "Intel® OpenVINO™ Tool Suite Elementary Course"를 살펴보는 것이 좋습니다. AI의 기본 개념부터 시작하여 인공 지능 및 비전 애플리케이션에 대한 관련 지식을 소개하며, 사용자가 Intel® OpenVINO™ 도구 제품군의 기본 개념과 애플리케이션 시나리오를 빠르게 이해할 수 있도록 도와줍니다. 전체 과정에는 비디오 처리, 딥 러닝 관련 지식, 인공 지능 애플리케이션을 위한 추론 가속화, Intel® OpenVINO™ 도구 모음의 데모 데모가 포함되어 있어 딥 러닝을 더 얕은 것부터 더 깊은 것까지 마스터할 수 있습니다.

5. 컴퓨터 비전의 일반적인 작업

  • 이미지 분류

이미지 분류는 의미 정보를 기반으로 이미지의 다양한 카테고리를 구분하는 것입니다. 이는 컴퓨터 비전의 핵심이며 객체 감지, 이미지 분할, 객체 추적, 및 행동 분석, 얼굴 인식 및 기타 높은 수준의 시각적 작업. 예를 들어 아래 그림에서 컴퓨터는 이미지 분류를 통해 이미지 속의 사람, 나무, 풀, 하늘을 인식합니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

이미지 분류는 보안 분야의 얼굴 인식 및 지능형 영상 분석, 교통 분야의 교통 상황 인식, 콘텐츠 기반 이미지 검색, 인터넷 사진 앨범 자동 분류 등 다양한 분야에서 널리 사용됩니다. 분야, 의료분야의 영상인식 등

  • 객체 감지

객체 감지 작업의 목표는 이미지 또는 비디오 프레임을 제공하고 컴퓨터가 그 안에 있는 모든 객체의 위치를 ​​찾아 각 객체의 특정 카테고리를 제공하도록 하는 것입니다. 아래 그림과 같이 사람 인식 및 감지를 예로 들면, 테두리는 이미지 속 모든 사람의 위치를 ​​표시하는 데 사용됩니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

다중 범주 표적 탐지에서는 일반적으로 아래 그림과 같이 서로 다른 색상의 테두리를 사용하여 탐지된 여러 물체의 위치를 ​​표시합니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

  • 의미론적 분할

의미론적 분할은 컴퓨터 비전의 기본 작업입니다. 의미론적으로 해석 가능한 다양한 범주로 시각적 입력을 나누어야 합니다. 전체 이미지를 픽셀 그룹으로 나눈 다음 레이블을 지정하고 분류합니다. 예를 들어, 자동차에 속하는 이미지의 모든 픽셀을 구별하고 해당 픽셀을 파란색으로 칠할 수 있습니다. 아래 그림과 같이 이미지는 사람(빨간색), 나무(진한 녹색), 풀(연한 녹색), 하늘(파란색) 레이블로 구분됩니다.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

인스턴스 분할은 대상 감지와 의미론적 분할의 조합입니다. 이미지에서 대상을 감지한 다음(대상 감지) 각 픽셀에 레이블을 지정합니다(의미론적 분할). 위와 아래의 그림을 비교하면, 휴먼 타겟을 사용하는 경우 의미론적 분할에서는 동일한 카테고리에 속하는 서로 다른 인스턴스를 구분하지 못하는 반면(모든 사람은 빨간색으로 표시됨), 인스턴스 분할에서는 동일한 카테고리에 속하는 서로 다른 인스턴스(다른 인스턴스)를 구분하는 것을 알 수 있습니다. 색상은 다른 사람을 구별하는 데 사용됩니다.)

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

목표 추적 목표 추적이란 이미지 시퀀스에서 움직이는 목표를 감지, 추출, 식별 및 추적하고, 움직이는 목표의 모션 매개변수를 획득하고, 처리 및 분석하고, 더 많은 것을 완료하기 위해 움직이는 목표에 대한 행동 이해를 달성하는 것을 의미합니다. 더 높은 수준의 탐지 작업.

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

6. 일상 생활에서의 컴퓨터 비전 적용 시나리오

컴퓨터 비전의 적용 시나리오는 매우 광범위합니다. ·출입통제 및 알리페이 얼굴인식

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

  • 주차장, 요금소 번호판 인식

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

  • 웹사이트나 앱에 영상 업로드 시 위험 식별

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

  • Tik Tok 대기 중 다양한 셀카 소품을 APP에서 사용하려면 (먼저 얼굴의 위치를 ​​인식해야 합니다.)

유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사

7. 컴퓨터 비전이 직면한 과제

현재 컴퓨터 비전 기술은 빠르게 발전하여 예비 산업 규모에 이르렀습니다. 미래의 컴퓨터 비전 기술 개발은 주로 다음과 같은 과제에 직면해 있습니다. 첫째, 다양한 응용 분야의 다른 기술과 어떻게 더 잘 결합할 것인가? 컴퓨터 비전은 특정 문제를 해결할 때 빅데이터를 광범위하게 활용할 수 있습니다. 그러나 일부 문제에서는 높은 정확도를 달성하는 것이 불가능합니다. 두 번째는 컴퓨터 비전 알고리즘의 개발 시간과 인건비를 줄이는 방법입니다. 현재 컴퓨터 비전 알고리즘에는 많은 양의 데이터와 수동 주석이 필요합니다. 응용 분야의 요구 사항을 충족하려면 긴 연구 개발 주기가 필요합니다. 세 번째는 새로운 이미징 하드웨어와 인공 지능 칩의 출현으로 설계 및 개발 속도를 높이는 방법입니다. , 다양한 칩 및 데이터 수집 장비를 위한 컴퓨터 비전 알고리즘의 설계 및 개발도 과제 중 하나입니다.

8. 결론

컴퓨터 비전은 인공 지능 분야에서 가장 빠르게 성장하고 가장 널리 사용되는 기술 중 하나이며, 모든 계층의 더 많은 정보를 캡처하고 분석하는 인공 지능의 "눈"과 같습니다. 알고리즘의 변화, 하드웨어 컴퓨팅 성능의 업그레이드, 데이터의 폭발적 증가, 향후 5G 기술 발전으로 인한 고속 네트워크로 인해 컴퓨터 비전은 응용 측면에서도 더 넓은 개발 공간을 갖게 될 것입니다. 기다려 보자!

위 내용은 유용한 정보가 가득한, 컴퓨터 비전을 이해하는 하나의 기사의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿