기술 주변기기 일체 포함 컴퓨터 비전 이미지 분류

컴퓨터 비전 이미지 분류

Apr 07, 2023 pm 10:01 PM
컴퓨터 그림 비전

이 기사는 Beishang 작가가 WeChat 공개 계정 "AI Origin"에서 재인쇄한 것입니다. 이 기사를 재인쇄하려면 AI Yuanqi 공개 계정에 문의하세요.

숫자를 말할 수 있나요?

AI라고 하면 누구나 생각하는 것은 '유랑지구 2'의 MOSS와 같은 지능형 하드웨어 생물일 것입니다. 인터넷만 제공된다면 그것은 어벤져스 2와 같을 것입니다. 울트론처럼 그는 인터넷을 이용해 곳곳에 자신을 전파하며, 항상 인류를 말살하고 '세계 평화'를 이루려는 계획을 생각한다.

컴퓨터 비전 이미지 분류

현실적으로 이 단계의 AI는 영화나 TV 작품에서 모두가 느끼고 경험하는 것과는 아직 거리가 멀습니다. 오늘은 사진 디지털 인식을 예로 들어 AI가 어떤 형태에 기반을 두고 있는지 살펴보겠습니다. 실제로 존재합니다. 기사는 단계별로 이해하는 데 도움이 되는 몇 가지 주요 질문으로 색인이 생성됩니다. 따라오세요~

숫자가 있는 사진입니다. (흐리지만) 숫자 '3'이 있는 사진입니다.

컴퓨터 비전 이미지 분류

첫 번째 질문: 실제 지능 - 이것이 숫자 "3"임을 분명히 알 수 있는 이유는 무엇입니까? 이것은 무엇을 의미 하는가?

이 사진을 보면 눈은 광학 신호를 망막의 빛 반사를 통해 뇌가 인식할 수 있는 생물학적 신호로 변환하고 이 부분의 정보를 일시적으로 저장합니다(실제로는 이해를 돕기 위한 것일 뿐이죠?). 당신의 망막에. 두뇌가 신호를 받은 후, 당신의 영리한 작은 두뇌는 이것이 숫자 "3"이라는 것을 재빨리 인식합니다. 이때 당신은 그림을 완전히 이해했으며 그것은 "3"입니다. 물론, 이 모든 것의 기초는 어린 시절부터 이 모양의 숫자가 5, 6 및 기타 숫자가 아닌 숫자 3과 "동등"하다고 배웠다는 것입니다.

컴퓨터 비전 이미지 분류

두 번째 질문: 눈, 망막 - 컴퓨터는 물리적 세계를 인식하기 위해 어떤 형태의 입력을 사용합니까?

컴퓨터와 AI는 어떤 관계인가요? 우리 자신이 지능과 생명을 갖고 있는 것처럼 AI는 컴퓨터의 컴퓨팅 파워와 아키텍처가 필요한 일종의 유사 지능 능력이라고 간단히 이해할 수 있지만 사실 우리는 본질적으로 탄소 기반 유기체입니다. 우리 모두 알고 있듯이, 컴퓨터 세계는 이진 세계입니다. 간단히 말해서, 이진은 0이거나 1입니다. 0이나 1인 이진수에만 의존하여 그렇게 많은 기능을 수행할 수 있습니까? 당신은 그렇게 강력한 컴퓨팅 능력을 가지고 있습니까? 하지만 걱정하지 마십시오. 여기서 명확히 해야 할 개념이 있습니다. 즉, 이진수는 모든 진수의 숫자를 나타낼 수 있습니다(먼저 그것이 옳다고 생각할 수 있으며, 구체적으로 필요한 경우 나중에 이에 대해 이야기하겠습니다). 예를 들어 우리가 흔히 사용하는 십진법의 숫자 13을 이진법으로 하면 다음은 1101이다. 주의 깊게 공부하고 싶은 친구들은 아래 그림의 설명을 보면 된다.

컴퓨터 비전 이미지 분류

따라서 우리는 숫자의 경우 컴퓨터가 이진수를 통해 이를 "이해"할 수 있다는 것을 명확하게 이해할 수 있습니다. 그림을 일련의 숫자로 변환할 수 있다면 컴퓨터는 0과 1만 아는 바보에서 그림에서 정보를 입력할 수 있는 바보로 바뀔 수 있을까(이해가 안 되면 옆으로 치워두세요. 아이는 자라서 먼저 먹는 법을 배워야 합니다.) 아래 그림과 같이 그림의 각 작은 영역을 픽셀로 간주할 수 있으며, 하나의 픽셀은 우리 모두 알고 있듯이 빨간색, 녹색, 파란색(파란색)을 거쳐 통과할 수 있습니다. 왼쪽에서 오른쪽으로, 위에서 아래로 숫자 목록을 구성한 다음 이 내용을 컴퓨터로 보낼 수 있습니다.

컴퓨터 비전 이미지 분류

이 시점에서 컴퓨터가 이해하든 못하든 그림을 컴퓨터가 받아들일 수 있는 신호로 변환했습니다. 그렇다면 컴퓨터 두뇌는 그림 속 숫자가 "3"임을 어떻게 인식할까요?

세 번째 질문: 소위 AI - 컴퓨터는 이 그림의 숫자가 "3"이라고 어떻게 판단해야 합니까?

컴퓨터에 이렇게 두 장의 사진을 주면 왼쪽 그림이 숫자 "3"이라는 것을 알 수 있습니다. 너무 순진하다고 생각할 수도 있지만, 3살짜리 아이도 이 사실을 알고 있습니다. 그런데 오른쪽 사진에 푸른발얼가니 등 희귀 새 사진 10,000장이 나와 있고, 컴퓨터가 다양한 희귀 생물을 99%의 정확도로 정확하게 식별하는 데 몇 초 밖에 걸리지 않는다면, 그렇지 않습니까? 약간 AI같지?

컴퓨터 비전 이미지 분류

전통적인 인식 방법 - 구체적으로 이미지를 디지털 매트릭스로 변환할 수 있었습니다. 전통적인 이미지 인식 방법은 일부 엄격한 규칙을 특징으로 사용하는 등 이미지의 특징을 추출합니다. 숫자 "3"은 우리 뇌에서 이 모양을 볼 때 무의식적으로 "3"이라고 반응하지만, 컴퓨터에게는 일련의 숫자로 보입니다. 따라서 초기에 유사한 이미지 분류 작업을 수행할 때 엔지니어들은 숫자 "3"에 매핑된 디지털 시퀀스를 처리해야 했는데 이는 정말 골치 아픈 일이었습니다. 따라서 특징을 만드는 방법은 전통적인 이미지 인식 및 분류에서 중요하지만 매우 번거로운 프로세스입니다.

기존 인식 방식의 장점은 인식 결과가 잘못된 경우 특징을 표시하여 오류의 원인을 대략적으로 파악할 수 있다는 점입니다. 단점은 특징 추출이 번거롭다는 것입니다. 기능 엔지니어링을 약화시키고(기능 엔지니어링은 많은 후속 작업에서도 매우 중요하지만) 엔드투엔드 솔루션을 제공할 수 있는 방법이 있습니까? 소위 엔드투엔드(end-to-end)란 디지털 사진과 그 분류 결과만 제공하고 컴퓨터가 스스로 인식 솔루션을 학습하도록 하면 된다는 의미입니다(인간의 학습 아이디어와 약간 비슷합니까). 시대의 변화와 컴퓨터 컴퓨팅 능력의 획기적인 발전으로 인해 신경망을 기반으로 한 딥러닝 알고리즘이 점차 사용되기 시작했습니다.

컴퓨터 비전 이미지 분류

심층 신경망 인식 방법 - 이 단어는 매우 심오합니다. 컴퓨터를 배우지 않거나 알고리즘을 하지 않는 사람들은 직접적으로 겁을 먹을 수 있습니다. 심층 신경망이 무엇인지 한 문장으로 번역해 보겠습니다. : 입력 데이터와 지정된 레이블 간에는 일부 비선형 상관 관계가 있습니다. 신경망은 위에서 언급한 비선형 상관 관계를 대략적으로 맞추기 위해 여러 비선형 함수를 사용합니다. 아래 그림과 같이 가장 왼쪽 그림(문자 "A")이 간단한 심층 신경망이고 오른쪽은 그림을 숫자로 변환하여 "지능형" 연산을 수행하는 구조로, 이는 "뇌"로 이해될 수 있습니다. ".

컴퓨터 비전 이미지 분류

위 내용은 컴퓨터 비전 이미지 분류의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Xiaohongshu에 게시할 때 사진이 자동으로 저장되는 문제를 해결하는 방법은 무엇입니까? 포스팅 시 자동으로 저장되는 이미지는 어디에 있나요? Xiaohongshu에 게시할 때 사진이 자동으로 저장되는 문제를 해결하는 방법은 무엇입니까? 포스팅 시 자동으로 저장되는 이미지는 어디에 있나요? Mar 22, 2024 am 08:06 AM

소셜 미디어의 지속적인 발전으로 Xiaohongshu는 점점 더 많은 젊은이들이 자신의 삶을 공유하고 아름다운 것을 발견할 수 있는 플랫폼이 되었습니다. 많은 사용자들이 이미지 게시 시 자동 저장 문제로 고민하고 있습니다. 그렇다면 이 문제를 해결하는 방법은 무엇입니까? 1. Xiaohongshu에 게시할 때 사진이 자동으로 저장되는 문제를 해결하는 방법은 무엇입니까? 1. 캐시 지우기 먼저 Xiaohongshu의 캐시 데이터를 지워볼 수 있습니다. 단계는 다음과 같습니다. (1) Xiaohongshu를 열고 오른쪽 하단에 있는 "내" 버튼을 클릭합니다. (2) 개인 센터 페이지에서 "설정"을 찾아 클릭합니다. 캐시 지우기' 옵션을 선택하고 확인을 클릭하세요. 캐시를 삭제한 후 샤오홍슈에 다시 진입하여 사진을 올려 자동 저장 문제가 해결되었는지 확인해 보세요. 2. Xiaohongshu 버전을 업데이트하여 Xiaohongshu를 확인하세요.

2024년 CSRankings 전국 컴퓨터 과학 순위 발표! CMU가 목록을 장악하고 MIT가 상위 5위에서 벗어났습니다. 2024년 CSRankings 전국 컴퓨터 과학 순위 발표! CMU가 목록을 장악하고 MIT가 상위 5위에서 벗어났습니다. Mar 25, 2024 pm 06:01 PM

2024CSRankings 전국 컴퓨터 공학 전공 순위가 방금 발표되었습니다! 올해 미국 최고의 CS 대학 순위에서는 카네기멜론대학교(CMU)가 CS 분야 전국 최고에 올랐고, 일리노이대학교 어바나-샴페인 캠퍼스(UIUC)가 1위를 차지했다. 6년 연속 2위를 기록했다. 조지아공대(Georgia Tech)가 3위를 차지했습니다. 이어 스탠퍼드대, 캘리포니아대 샌디에이고대, 미시간대, 워싱턴대가 공동 4위를 차지했다. MIT의 순위가 하락해 상위 5위권 밖으로 떨어졌다는 점은 주목할 만하다. CSRankings는 매사추세츠 대학교 Amherst 컴퓨터 및 정보 과학부의 Emery Berger 교수가 시작한 컴퓨터 과학 분야의 글로벌 대학 순위 프로젝트입니다. 순위는 객관적인 기준에 따라 결정됩니다.

원격 데스크톱은 원격 컴퓨터의 ID를 인증할 수 없습니다. 원격 데스크톱은 원격 컴퓨터의 ID를 인증할 수 없습니다. Feb 29, 2024 pm 12:30 PM

Windows 원격 데스크톱 서비스를 사용하면 사용자가 원격으로 컴퓨터에 액세스할 수 있으므로 원격으로 작업해야 하는 사람들에게 매우 편리합니다. 그러나 사용자가 원격 컴퓨터에 연결할 수 없거나 원격 데스크톱이 컴퓨터의 ID를 인증할 수 없는 경우 문제가 발생할 수 있습니다. 이는 네트워크 연결 문제 또는 인증서 확인 실패로 인해 발생할 수 있습니다. 이 경우 사용자는 네트워크 연결을 확인하고 원격 컴퓨터가 온라인인지 확인한 후 다시 연결을 시도해야 할 수 있습니다. 또한 원격 컴퓨터의 인증 옵션이 올바르게 구성되었는지 확인하는 것이 문제 해결의 핵심입니다. Windows 원격 데스크톱 서비스와 관련된 이러한 문제는 일반적으로 설정을 주의 깊게 확인하고 조정하여 해결할 수 있습니다. 원격 데스크톱은 시간 또는 날짜 차이로 인해 원격 컴퓨터의 ID를 확인할 수 없습니다. 계산을 확실히 해주세요

TikTok 댓글에 사진을 게시하는 방법은 무엇입니까? 댓글란에 있는 사진의 입구는 어디인가요? TikTok 댓글에 사진을 게시하는 방법은 무엇입니까? 댓글란에 있는 사진의 입구는 어디인가요? Mar 21, 2024 pm 09:12 PM

Douyin 짧은 동영상의 인기로 인해 댓글 영역의 사용자 상호 작용이 더욱 다채로워졌습니다. 일부 사용자는 자신의 의견이나 감정을 더 잘 표현하기 위해 댓글로 이미지를 공유하기를 원합니다. 그렇다면 TikTok 댓글에 사진을 게시하는 방법은 무엇입니까? 이 기사에서는 이 질문에 대해 자세히 답변하고 몇 가지 관련 팁과 예방 조치를 제공합니다. 1. Douyin 댓글에 사진을 어떻게 게시하나요? 1. Douyin 열기: 먼저 Douyin 앱을 열고 계정에 로그인해야 합니다. 2. 댓글 영역 찾기: 짧은 동영상을 탐색하거나 게시할 때 댓글을 달고 싶은 위치를 찾아 "댓글" 버튼을 클릭하세요. 3. 댓글 내용 입력: 댓글 영역에 댓글 내용을 입력합니다. 4. 사진 전송 선택: 댓글 내용 입력 인터페이스에 "사진" 버튼 또는 "+" 버튼이 표시됩니다.

iPhone에서 사진을 더 선명하게 만드는 6가지 방법 iPhone에서 사진을 더 선명하게 만드는 6가지 방법 Mar 04, 2024 pm 06:25 PM

Apple의 최근 iPhone은 선명한 디테일, 채도 및 밝기로 추억을 포착합니다. 그러나 때로는 이미지가 덜 선명하게 보일 수 있는 몇 가지 문제가 발생할 수 있습니다. iPhone 카메라의 자동 초점 기능이 크게 발전하여 사진을 빠르게 촬영할 수 있게 되었지만, 특정 상황에서는 카메라가 실수로 잘못된 피사체에 초점을 맞춰 원치 않는 영역에서 사진이 흐릿해질 수 있습니다. iPhone의 사진이 일반적으로 초점이 맞지 않거나 선명도가 부족한 경우 다음 게시물을 통해 사진을 더 선명하게 만드는 데 도움이 될 것입니다. iPhone에서 사진을 더 선명하게 만드는 방법 [6가지 방법] 기본 사진 앱을 사용하여 사진을 정리할 수 있습니다. 더 많은 기능과 옵션을 원하신다면

PPT 사진을 하나씩 나타나게 하는 방법 PPT 사진을 하나씩 나타나게 하는 방법 Mar 25, 2024 pm 04:00 PM

파워포인트에서는 그림을 하나씩 표시하는 것이 일반적인 기술인데, 이는 애니메이션 효과를 설정하면 가능하다. 이 가이드에서는 기본 설정, 이미지 삽입, 애니메이션 추가, 애니메이션 순서 및 타이밍 조정 등 이 기술을 구현하는 단계를 자세히 설명합니다. 또한 트리거 사용, 애니메이션 속도 및 순서 조정, 애니메이션 효과 미리보기 등의 고급 설정 및 조정이 제공됩니다. 이러한 단계와 팁을 따르면 사용자는 PowerPoint에서 그림이 차례로 표시되도록 쉽게 설정할 수 있으므로 프레젠테이션의 시각적 효과가 향상되고 청중의 관심을 끌 수 있습니다.

ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. May 30, 2024 am 09:35 AM

이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

Foxit PDF Reader를 사용하여 PDF 문서를 jpg 이미지로 변환하는 방법 - Foxit PDF Reader를 사용하여 PDF 문서를 jpg 이미지로 변환하는 방법 Foxit PDF Reader를 사용하여 PDF 문서를 jpg 이미지로 변환하는 방법 - Foxit PDF Reader를 사용하여 PDF 문서를 jpg 이미지로 변환하는 방법 Mar 04, 2024 pm 05:49 PM

Foxit PDF Reader 소프트웨어도 사용하고 계십니까? 그렇다면 Foxit PDF Reader가 PDF 문서를 jpg 이미지로 변환하는 방법을 알고 계십니까? 다음 기사에서는 변환 방법에 관심이 있는 사람들을 위해 Foxit PDF Reader가 PDF 문서를 jpg 이미지로 변환하는 방법을 설명합니다. jpg 이미지를 보려면 아래를 방문하여 살펴보시기 바랍니다. 먼저 Foxit PDF Reader를 시작한 다음 상단 도구 모음에서 "기능"을 찾은 다음 "PDF를 다른 사람에게 보내기" 기능을 선택하십시오. 다음으로 "Foxit PDF 온라인 변환"이라는 웹 페이지를 엽니다. 페이지 오른쪽 상단의 "로그인" 버튼을 클릭하여 로그인한 후 "PDF를 이미지로" 기능을 활성화하세요. 그런 다음 업로드 버튼을 클릭하고 이미지로 변환하려는 PDF 파일을 추가한 후 "변환 시작"을 클릭하세요.

See all articles