影像辨識是以影像的主要特徵為基礎。每個影像都有它的特徵,對影像辨識時眼動的研究表明,視線總是集中在影像的主要特徵上,也就是集中在影像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的資訊量最大;而且眼睛的掃描路線也總是依序從一個特徵轉到另一個特徵。
本教學操作環境:windows7系統、Dell G3電腦。
影像辨識技術是人工智慧的一個重要領域。它是指對影像進行物件識別,以識別各種不同模式的目標和物件的技術。
影像辨識的發展經歷了三個階段:文字辨識、數位影像處理與辨識、物件辨識。影像識別,顧名思義,就是對影像做出各種處理、分析,最終辨識出我們所要研究的目標。今天所指的圖像識別並不僅僅是用人類的肉眼,而是藉助電腦技術進行識別。
影像辨識技術原理
電腦的影像辨識技術和人類的影像辨識在原理上並沒有本質上的區別,人類的影像識別都是依靠圖像所具有的本身特徵分類,然後透過各個類別所具有的特徵將圖像識別出來的,當看到一張圖片時,我們的大腦會迅速感應到是否見過此圖片或與其相似的圖片。
在這個過程中,我們的大腦會根據儲存記憶中已經分好的類別進行識別,查看是否有與該影像具有相同或類似特徵的儲存記憶,從而識別出是否見過該影像。
影像辨識技術可能是以影像的主要特徵為基礎的。 每個影像都有它的特徵,如字母A有個尖,P有個圈、而Y的中心有個銳角等。對影像辨識時眼動的研究表明,視線總是集中在影像的主要特徵上,也就是集中在影像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的資訊量最大。而且眼睛的掃描路線也總是依序從一個特徵轉到另一個特徵。由此可見,在影像辨識過程中,知覺機制必須排除輸入的多餘資訊,抽出關鍵的資訊。同時,在大腦裡必定有一個負責整合資訊的機制,它能把分階段獲得的資訊整理成一個完整的知覺映像。
模式識別是人工智慧和資訊科學的重要組成部分。模式識別是指對錶示事物或現象的不同形式的資訊做分析和處理從而得到一個對事物或現像做出描述、辨認和分類等的過程。
影像辨識技術是以影像的主要特徵為基礎的。每個影像都有它的特徵,對影像辨識時眼動的研究表明,視線總是集中在影像的主要特徵上,也就是集中在影像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的資訊量最大。而且眼睛的掃描路線也總是依序從一個特徵轉到另一個特徵。由此可見,在影像辨識過程中,知覺機制必須排除輸入的多餘訊息,抽出關鍵的訊息。同時,在大腦中必定有一個負責整合資訊的機制,它能把分階段所獲得的資訊整理成一個完整的知覺映像。
影像辨識技術的過程
既然電腦的影像辨識技術與人類的影像辨識原理相同,那它們的過程也是大同小異的。影像辨識技術的過程分為以下幾個步驟:資訊的取得、預處理、特徵抽取與選擇、分類器設計與分類決策。
資訊的取得是指透過感測器,將光或聲音等資訊轉換為電資訊。也就是獲取研究對象的基本資訊並透過某種方法將其轉變為機器能夠認識的資訊。
預處理主要是指影像處理中的去雜訊、平滑、變換等的操作,從而加強影像的重要特徵。
特徵擷取與選擇是指在模式辨識中,需要進行特徵的抽取與選擇。簡單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區分開,就要透過這些圖像所具有的本身特徵來識別,而獲取這些特徵的過程就是特徵抽取。
在特徵抽取中所得到的特徵也許對此識別並不都是有用的,這個時候就要提取有用的特徵,這就是特徵的選擇。特徵抽取和選擇在影像辨識過程中是非常關鍵的技術之一,所以對這一步的理解是影像辨識的重點。
影像辨識技術應用有哪些?
影像辨識分為生物辨識、物件與場景辨識、影片辨識。其中生物辨識包括指紋、掌形、眼睛(視網膜和虹膜)、臉型等;物體與場景辨識包括:簽名、語音、行走的步態、擊打鍵盤的力度等。
影像辨識是一個綜合性的問題,涵蓋影像配對、影像分類、影像擷取、臉部偵測、行人偵測等技術,並在網路搜尋引擎、自動駕駛、醫學分析、遙感分析等領域具有廣泛的應用價值。
更多相關知識,請造訪常見問題欄位!
以上是影像辨識是以影像的什麼為基礎的詳細內容。更多資訊請關注PHP中文網其他相關文章!