首页 科技周边 人工智能 计算机视觉之图片分类

计算机视觉之图片分类

Apr 07, 2023 pm 10:01 PM
计算机 图片 视觉

本文转载自微信公众号「 AI源起」,作者北上。转载本文请联系AI源起公众号。

你会分辨数字吗?

说起AI,大家心里想到的一定是如“流浪地球2”中的MOSS一样的带有智慧的硬件生物,仿佛无所不知、无所不能,只要给他Internet就会像复联2中的奥创一样,利用网络把自身传播的无处不在,总想着消灭人类达到“世界和平”的计划。

图片

然而实际来说,现阶段的AI离大家在影视作品中感受和体会到的,还有相当大的差距,今天就拿图片数字识别为例,一起探索下AI到底是以一种什么形式实际存在的。文章会以一些关键问题为索引,带你一步步理解。Follow me, let’s go ~

这是一张带有数字的图片,相信你一定是看到后立刻就能反应过来,这是一张带有数字“3”的图片(即便它比较模糊)。

图片

第一个问题:真正的智慧体——你为什么能清楚的知道这是数字“3”?这背后代表了什么?

当你看向这张图片,你的眼睛通过光反射在视网膜上将光学信号转换为大脑能识别的生物信号,并将这部分信息暂存(仅辅助理解,实际并不是?)在了你的视网膜上。大脑接受到信号后,通过你聪明的小脑袋迅速认识到这是一个数字“3”,此时你已经对这张图片完全理解了,它就是一张“3”。当然,这一切的基础上,是你从小被教育过,这种形状的数字「等价于」数字3,而不是5、6等其他数字。

图片

第二个问题:眼睛、视网膜——计算机对于实体世界的认知是通过什么形式输入的?

计算机和AI什么关系呢?我们可以简单理解为AI是需要计算机的算力和体系结构一种伪智慧能力,就好比我们自身带有智慧和生命,但是其实本质上就是碳基生物。众所周知,计算机世界里是二进制世界,何谓二进制,简单来说就是非0即1。我知道你此时肯定有疑惑,就靠非0即1的二进制,就能实现这么多功能,有这么强大的算力吗?但先别急,这里需要明确一个概念,就是二进制可以表示任何进制的数字(可以先认为是对的,具体为什么需要的话,咱们后续再聊),比如我们常用的十进制下数字13,在二进制下是 1101,想仔细学习的小伙伴可以看下面图片的解释。

图片

因此我们能明确出,对于一个数字,计算机都能够通过二进制来“理解”。如果图片能够转化成一串数字,计算机是不是就能从一个只知道0和1的呆瓜,变成可以将图片进行信息输入(理解不理解先搁一边,就像孩子长个总得先会吃饭)。如下图,图片每个小区域可以认为是一个像素,一个像素点就代表了一种颜色,那又要众所周知了,任何一种颜色都能通过红色(Red)、绿色(Green)、蓝色(Blue)的不同配比调制出来,那我们按照从左到右,从上到下的顺序,就能形成一个数字列表,那把这些内容送给计算机。

图片

到这一步,不管计算机理解与否,我们已经将图片转换为了计算机能够接受的信号,那计算机的大脑是怎么识别图片中的数字是“3”呢

第三个问题:所谓的AI——计算机应该如何判断这张图片中的数字是“3”

给计算机这样两张图片,它能告诉你左边这张图片是数字“3”,你认为他是具有人工智能吗?你可能觉得这也太naive了,这3岁小孩都知道。但是如果像右图是1万张蓝脚鲣鸟等稀奇鸟类的图片,计算机只用了几秒钟就能以99%的准确率一字不差的判断出来各种稀奇生物,那是不是就有点AI那味了?

图片

传统识别方法——具体来说,我们已经能够将图片转换为数字矩阵了,传统的图片识别方法会将对图片中的特征进行抽取,比如会利用一些硬规则当做特征。对于数字“3”,在我们人脑中一看到这个形状,就下意识反应出来这是“3”,但是对于计算机他是一串数字呀。所以早期在做类似图片分类任务的时候,工程师需要对数字“3”映射下的数字序列进行处理,这可真令人头大。所以如何做特征就是在传统图片识别分类中,一个至关重要,但是极其繁琐的过程。

传统识别方法优势在于,当识别结果出错时候,你可以通过显示特征大致判断错误原因,弊端在于特征工程繁琐。那有没有这样一种方法,可以弱化特征工程(虽然后面很多任务,特征工程也极其重要),给一种端到端的解决方案。所谓端到端,就是我只需要给一张数字图片,和它的分类结果,让计算机自己学习出识别的解决方案(是不是有点像人类的学习思路了)。这里经过时代变迁和计算机的算力大幅提升,基于神经网络的深度学习算法逐渐有了用武之地。

图片

深度神经网络识别方法——这几个字很深奥,不学计算机不搞算法的可能直接被唬住了,我用一句话翻译翻译什么叫深度神经网络(狗头.jpg):输入数据和指定标签之间存在某种非线性的关联,神经网络就是通过多个非线性函数去近似拟合上述的非线性关联。如下图,就是一个简单的深度神经网络,最左侧的图片(字母“A”),右侧呢就是将图片转换为数字后,进行“智能”运算的结构体,可以理解为“大脑”。

图片

以上是计算机视觉之图片分类的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

小红书发布自动保存图片怎么解决?发布自动保存图片在哪里? 小红书发布自动保存图片怎么解决?发布自动保存图片在哪里? Mar 22, 2024 am 08:06 AM

随着社交媒体的不断发展,小红书已经成为越来越多年轻人分享生活、发现美好事物的平台。许多用户在发布图片时遇到了自动保存的问题,这让他们感到十分困扰。那么,如何解决这个问题呢?一、小红书发布自动保存图片怎么解决?1.清除缓存首先,我们可以尝试清除小红书的缓存数据。步骤如下:(1)打开小红书,点击右下角的“我的”按钮;(2)在个人中心页面,找到“设置”并点击;(3)向下滚动,找到“清除缓存”选项,点击确认。清除缓存后,重新进入小红书,尝试发布图片看是否解决了自动保存的问题。2.更新小红书版本确保你的小

2024 CSRankings全美计算机科学排名发布!CMU霸榜,MIT跌出前5 2024 CSRankings全美计算机科学排名发布!CMU霸榜,MIT跌出前5 Mar 25, 2024 pm 06:01 PM

2024CSRankings全美计算机科学专业排名,刚刚发布了!今年,全美全美CS最佳大学排名中,卡耐基梅隆大学(CMU)在全美和CS领域均名列前茅,而伊利诺伊大学香槟分校(UIUC)连续六年稳定地位于第二。佐治亚理工学院则排名第三。然后,斯坦福大学、圣迭戈加利福尼亚大学、密歇根大学、华盛顿大学并列世界第四。值得注意的是,MIT排名下跌,跌出前五。CSRankings是由麻省州立大学阿姆赫斯特分校计算机与信息科学学院教授EmeryBerger发起的全球院校计算机科学领域排名项目。该排名基于客观的

远程桌面无法验证远程计算机的身份 远程桌面无法验证远程计算机的身份 Feb 29, 2024 pm 12:30 PM

Windows远程桌面服务允许用户远程访问计算机,对于需要远程工作的人来说非常便利。然而,当用户无法连接到远程计算机或远程桌面无法验证计算机身份时,会遇到问题。这可能是由网络连接问题或证书验证失败引起的。在这种情况下,用户可能需要检查网络连接、确保远程计算机是在线的,并尝试重新连接。另外,确保远程计算机的身份验证选项已正确配置也是解决问题的关键。通过仔细检查和调整设置,通常可以解决Windows远程桌面服务中出现的这类问题。由于存在时间或日期差异,远程桌面无法验证远程计算机的身份。请确保您的计算

抖音评论里怎么发图片?评论区图片入口在哪里? 抖音评论里怎么发图片?评论区图片入口在哪里? Mar 21, 2024 pm 09:12 PM

随着抖音短视频的火爆,用户们在评论区互动变得更加丰富多彩。有些用户希望在评论中分享图片,以更好地表达自己的观点或情感。那么,抖音评论里怎么发图片呢?本文将为你详细解答这个问题,并为你提供一些相关的技巧和注意事项。一、抖音评论里怎么发图片?1.打开抖音:首先,你需要打开抖音APP,并登录你的账号。2.找到评论区:在浏览或发布短视频时,找到想要评论的地方,点击“评论”按钮。3.输入评论内容:在评论区输入你的评论内容。4.选择发送图片:在输入评论内容的界面,你会看到一个“图片”按钮或者“+”号按钮,点

在 iPhone 上使图片更清晰的 6 种方法 在 iPhone 上使图片更清晰的 6 种方法 Mar 04, 2024 pm 06:25 PM

Apple最近的iPhone可以通过清晰的细节、饱和度和亮度来捕捉回忆。但有时,您可能会遇到一些问题,这些问题可能会导致图像看起来不那么清晰。尽管iPhone相机上的自动对焦已经取得了长足的进步,可以让您快速拍照,但相机在某些情况下可能会错误地对焦错误的拍摄对象,从而使照片在不需要的区域更加模糊。如果iPhone上的照片看起来失焦或总体上缺乏清晰度,以下帖子应该可以帮助您使它们更清晰。如何在iPhone上使图片更清晰[6种方法]您可以尝试使用本机的“照片”应用来清理照片。如果您需要更多功能和选项

ppt怎么让图片一张一张出来 ppt怎么让图片一张一张出来 Mar 25, 2024 pm 04:00 PM

在PowerPoint中,让图片逐一显示是一种常用的技巧,可以通过设置动画效果来实现。本指南详细介绍了实现这一技巧的步骤,包括基本设置、图片插入、添加动画、调整动画顺序和时间。此外,还提供了高级设置和调整,例如使用触发器、调整动画速度和顺序,以及预览动画效果。通过遵循这些步骤和技巧,用户可以轻松地在PowerPoint中设置图片逐一出现,从而提升演示文稿的视觉效果并吸引观众的注意力。

超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定 超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定 May 30, 2024 am 09:35 AM

写在前面今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低光条件、动态光照、弱纹理区域和严重抖动等挑战性场景中的适应性。我们的系统支持多种模式,包括拓展单目、立体、单目-惯性以及立体-惯性配置。除此之外,还分析了如何将视觉SLAM与深度学习方法相结合,以启发其他研究。通过在公共数据集和自采样数据上的广泛实验,展示了SL-SLAM在定位精度和跟踪鲁棒性方面优

福昕PDF阅读器如何将pdf文档转成jpg图片-福昕PDF阅读器将pdf文档转成jpg图片的方法 福昕PDF阅读器如何将pdf文档转成jpg图片-福昕PDF阅读器将pdf文档转成jpg图片的方法 Mar 04, 2024 pm 05:49 PM

你们是不是也在使用福昕PDF阅读器软件呢?那么你们知道福昕PDF阅读器如何将pdf文档转成jpg图片吗?下面这篇文章就为大伙带来了福昕PDF阅读器将pdf文档转成jpg图片的方法,感兴趣的小伙伴们快来下文看看吧。先启动福昕PDF阅读器,接着在顶部工具栏找到“特色功能”,然后选择“PDF转其他”功能。在接下来,打开一个名为“福昕pdf在线转换”的网页。在页面上方右侧点击“登录”按钮进行登录,然后打开“PDF转图片”功能。之后点击上传按钮并将想要转换成图片的pdf文件添加进来,添加完毕后点击“开始转

See all articles