首頁 科技週邊 人工智慧 電腦視覺之圖片分類

電腦視覺之圖片分類

Apr 07, 2023 pm 10:01 PM
電腦 圖片 視覺

本文轉載自微信公眾號「 AI源起」,作者北上。轉載本文請聯絡AI源起公眾號。

你會分辨數字嗎?

說起AI,大家心裡想到的一定是如「流浪地球2」中的MOSS一樣的帶有智慧的硬體生物,彷彿無所不知、無所不能,只要給他Internet就會像復聯2中的奧創一樣,利用網路把自身傳播的無所不在,總想著要消滅人類達到「世界和平」的計畫。

電腦視覺之圖片分類

然而實際上來說,現階段的AI離大家在影視作品中感受和體會到的,還有相當大的差距,今天就拿圖片數字辨識為例,一起探索下AI到底是以一種什麼形式實際存在的。文章會以一些關鍵問題為索引,帶你一步步理解。 Follow me, let's go ~

這是一張帶有數字的圖片,相信你一定是看到後立刻就能反應過來,這是一張帶有數字“3”的圖片(即便它比較模糊)。

電腦視覺之圖片分類

第一個問題:真正的智慧體-為什麼你能清楚的知道這是數字「3」?這背後代表了什麼?

當你看向這張圖片,你的眼睛透過光反射在視網膜上將光學訊號轉換為大腦能辨識的生物訊號,並將這部分資訊暫存(僅輔助理解,實際上並不是?)在了你的視網膜上。大腦接受到訊號後,透過你聰明的小腦袋迅速認識到這是一個數字“3”,此時你已經對這張圖片完全理解了,它就是一張“3”。當然,這一切的基礎上,是你從小被教育過,這種形狀的數字「等價於」數字3,而不是5、6等其他數字。

電腦視覺之圖片分類

第二個問題:眼睛、視網膜-電腦對於實體世界的認知是透過什麼形式輸入的?

電腦和AI什麼關係呢?我們可以簡單理解為AI是需要電腦的算力和體系結構一種偽智慧能力,就好比我們自身帶有智慧和生命,但是其實本質上就是碳基生物。眾所周知,電腦世界裡是二進制世界,何謂二進制,簡單來說就是非0即1。我知道你此時一定有疑惑,就靠非0即1的二進制,就能實現這麼多功能,有這麼強大的算力嗎?但先別急,這裡需要明確一個概念,就是二進制可以表示任何進制的數字(可以先認為是對的,具體為什麼需要的話,咱們後續再聊),比如我們常用的十進制下數字13,在二進制下是 1101,想仔細學習的朋友可以看下面圖片的解釋。

電腦視覺之圖片分類

因此我們能明確出,對於一個數字,電腦都能夠透過二進位來「理解」。如果圖片能夠轉換成一串數字,計算機是不是就能從一個只知道0和1的呆瓜,變成可以將圖片進行資訊輸入(理解不理解先擱一邊,就像孩子長個總得先吃飯) 。如下圖,圖片每個小區域可以認為是一個像素,一個像素點就代表了一種顏色,那又要眾所周知了,任何一種顏色都能通過紅色(Red)、綠色(Green)、藍色( Blue)的不同配比調製出來,那我們按照從左到右,從上到下的順序,就能形成一個數字列表,那把這些內容送給計算機。

電腦視覺之圖片分類

到這一步,不管電腦理解與否,我們已經將圖片轉換為了電腦能夠接受的訊號,那電腦的大腦是怎麼辨識圖片中的數字是「3」呢

第三個問題:所謂的AI——電腦該如何判斷這張圖片中的數字是「3」

給電腦這樣兩張圖片,它能告訴你左邊這張圖片是數字“3”,你認為他是具有人工智慧嗎?你可能覺得這也太naive了,這3歲小孩都知道。但如果像右圖是1萬張藍腳鰹鳥等稀奇鳥類的圖片,計算機只用了幾秒鐘就能以99%的準確率一字不差的判斷出來各種稀奇生物,那是不是就有點AI那味了?

電腦視覺之圖片分類

傳統辨識方法-具體來說,我們已經能夠將圖片轉換為數字矩陣了,傳統的圖片辨識方法會將圖片中的特徵進行抽取,例如會利用一些硬規則當做特徵。對於數字“3”,在我們人腦中一看到這個形狀,就下意識反應出來這是“3”,但是對於計算機他是一串數字呀。所以早期在做類似圖片分類任務的時候,工程師需要對數字「3」映射下的數字序列進行處理,這可真是令人頭大。所以如何做特徵就是在傳統圖片辨識分類中,一個至關重要,但是極為繁瑣的過程。

傳統辨識方法優點在於,當辨識結果出錯時候,你可以透過顯示特徵大致判斷錯誤原因,弊端在於特徵工程繁瑣。那有沒有這樣一種方法,可以弱化特徵工程(雖然後面很多任務,特徵工程也極為重要),給一種端到端的解決方案。所謂端到端,就是我只需要給一張數位圖片,和它的分類結果,讓電腦自己學習出辨識的解決方案(是不是有點像人類的學習思路了)。這裡經過時代變遷和電腦的算力大幅提升,基於神經網路的深度學習演算法逐漸有了用武之地。

電腦視覺之圖片分類

深度神經網路辨識方法-這幾個字很深奧,不學電腦不搞演算法的可能直接被唬住了,我用一句話翻譯翻譯什麼叫深度神經網路(狗頭.jpg):輸入資料和指定標籤之間存在某種非線性的關聯,神經網路就是透過多個非線性函數去近似擬合上述的非線性關聯。如下圖,就是一個簡單的深度神經網絡,最左側的圖片(字母“A”),右側呢就是將圖片轉換為數字後,進行“智能”運算的結構體,可以理解為“大腦”。

電腦視覺之圖片分類

#

以上是電腦視覺之圖片分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

小紅書發布自動儲存圖片怎麼解決?發布自動保存圖片在哪裡? 小紅書發布自動儲存圖片怎麼解決?發布自動保存圖片在哪裡? Mar 22, 2024 am 08:06 AM

隨著社群媒體的不斷發展,小紅書已經成為越來越多年輕人分享生活、發現美好事物的平台。許多用戶在發布圖片時遇到了自動儲存的問題,這讓他們感到十分困擾。那麼,如何解決這個問題呢?一、小紅書發布自動儲存圖片怎麼解決? 1.清除快取首先,我們可以嘗試清除小紅書的快取資料。步驟如下:(1)開啟小紅書,點選右下角的「我的」按鈕;(2)在個人中心頁面,找到「設定」並點選;(3)向下捲動,找到「清除快取」選項,點擊確認。清除快取後,重新進入小紅書,嘗試發布圖片看是否解決了自動儲存的問題。 2.更新小紅書版本確保你的小

2024 CSRankings全美電腦科學排名發布! CMU霸榜,MIT跌出前5 2024 CSRankings全美電腦科學排名發布! CMU霸榜,MIT跌出前5 Mar 25, 2024 pm 06:01 PM

2024CSRankings全美電腦科學專業排名,剛剛發布了!今年,全美全美CS最佳大學排名中,卡內基美隆大學(CMU)在全美和CS領域均名列前茅,而伊利諾大學香檳分校(UIUC)則連續六年穩定地位於第二。佐治亞理工學院則排名第三。然後,史丹佛大學、聖迭戈加州大學、密西根大學、華盛頓大學並列世界第四。值得注意的是,MIT排名下跌,跌出前五名。 CSRankings是由麻省州立大學阿姆赫斯特分校電腦與資訊科學學院教授EmeryBerger發起的全球院校電腦科學領域排名計畫。該排名是基於客觀的

遠端桌面無法驗證遠端電腦的身份 遠端桌面無法驗證遠端電腦的身份 Feb 29, 2024 pm 12:30 PM

Windows遠端桌面服務允許使用者遠端存取計算機,對於需要遠端工作的人來說非常方便。然而,當使用者無法連線到遠端電腦或遠端桌面無法驗證電腦身分時,會遇到問題。這可能是由網路連線問題或憑證驗證失敗引起的。在這種情況下,使用者可能需要檢查網路連線、確保遠端電腦是線上的,並嘗試重新連線。另外,確保遠端電腦的身份驗證選項已正確配置也是解決問題的關鍵。透過仔細檢查和調整設置,通常可以解決Windows遠端桌面服務中出現的這類問題。由於存在時間或日期差異,遠端桌面無法驗證遠端電腦的身份。請確保您的計算

抖音評論裡怎麼發圖片?評論區圖片入口在哪裡? 抖音評論裡怎麼發圖片?評論區圖片入口在哪裡? Mar 21, 2024 pm 09:12 PM

隨著抖音短影片的火爆,用戶們在留言區互動變得更加豐富多彩。有些用戶希望在評論中分享圖片,以便更好地表達自己的觀點或情感。那麼,抖音評論裡怎麼發圖片呢?本文將為你詳細解答這個問題,並為你提供一些相關的技巧和注意事項。一、抖音評論裡怎麼發圖片? 1.開啟抖音:首先,你需要開啟抖音APP,並登入你的帳號。 2.找到評論區:瀏覽或發布短影片時,找到想要評論的地方,點擊「評論」按鈕。 3.輸入評論內容:在留言區輸入你的評論內容。 4.選擇傳送圖片:在輸入評論內容的介面,你會看到一個「圖片」按鈕或「+」號按鈕,點

在 iPhone 上讓圖片更清晰的 6 種方法 在 iPhone 上讓圖片更清晰的 6 種方法 Mar 04, 2024 pm 06:25 PM

Apple最近的iPhone可以透過清晰的細節、飽和度和亮度來捕捉回憶。但有時,您可能會遇到一些問題,這些問題可能會導致影像看起來不那麼清晰。儘管iPhone相機上的自動對焦已經取得了長足的進步,可以讓您快速拍照,但相機在某些情況下可能會錯誤地對焦錯誤的拍攝對象,從而使照片在不需要的區域更加模糊。如果iPhone上的照片看起來失焦或整體缺乏清晰度,以下貼文應該可以幫助您使它們更清晰。如何在iPhone上讓圖片更清晰[6種方法]您可以嘗試使用本機的「照片」應用程式來清理照片。如果您需要更多功能和選項

ppt怎麼讓圖片一張一張出來 ppt怎麼讓圖片一張一張出來 Mar 25, 2024 pm 04:00 PM

在PowerPoint中,讓圖片逐一顯示是常用的技巧,可以透過設定動畫效果來實現。本指南詳細介紹了實現此技巧的步驟,包括基本設定、圖片插入、新增動畫、調整動畫順序和時間。此外,還提供了進階設定和調整,例如使用觸發器、調整動畫速度和順序,以及預覽動畫效果。透過遵循這些步驟和技巧,使用者可以輕鬆地在PowerPoint中設定圖片逐一出現,從而提升簡報的視覺效果並吸引觀眾的注意力。

超越ORB-SLAM3! SL-SLAM:低光、嚴重抖動和弱紋理場景全搞定 超越ORB-SLAM3! SL-SLAM:低光、嚴重抖動和弱紋理場景全搞定 May 30, 2024 am 09:35 AM

寫在前面今天我們探討下深度學習技術如何改善在複雜環境中基於視覺的SLAM(同時定位與地圖建構)表現。透過將深度特徵提取和深度匹配方法相結合,這裡介紹了一種多功能的混合視覺SLAM系統,旨在提高在諸如低光條件、動態光照、弱紋理區域和嚴重抖動等挑戰性場景中的適應性。我們的系統支援多種模式,包括拓展單目、立體、單目-慣性以及立體-慣性配置。除此之外,也分析如何將視覺SLAM與深度學習方法結合,以啟發其他研究。透過在公共資料集和自採樣資料上的廣泛實驗,展示了SL-SLAM在定位精度和追蹤魯棒性方面優

福昕PDF閱讀器如何將pdf文件轉成jpg圖片-福昕PDF閱讀器將pdf文件轉成jpg圖片的方法 福昕PDF閱讀器如何將pdf文件轉成jpg圖片-福昕PDF閱讀器將pdf文件轉成jpg圖片的方法 Mar 04, 2024 pm 05:49 PM

你們是不是也在使用福昕PDF閱讀器軟體呢?那麼你們知道福昕PDF閱讀器如何將pdf文檔轉成jpg圖片嗎?下面這篇文章就為大夥帶來了福昕PDF閱讀器將pdf文檔轉成jpg圖片的方法,有興趣的夥伴們快來下文看看吧。先啟動福昕PDF閱讀器,接著在頂部工具列找到“特色功能”,然後選擇“PDF轉其他”功能。在接下來,開啟一個名為「福昕pdf線上轉換」的網頁。在頁面上方右側點選「登入」按鈕進行登錄,然後開啟「PDF轉圖片」功能。之後點擊上傳按鈕並將想要轉換成圖片的pdf檔加入進來,加入完畢後點擊「開始轉

See all articles