TensorFlow应用技术拓展—图像分类
1.科研平台环境部署操作拓展
针对于机器学习中的模型训练,本人推荐大家多学习TensorFlow官方的课程或资源,比如中国大学MOOC上的两门课程《 TensorFlow 入门实操课程 》和《 TensorFlow 入门课程 - 部署篇 》。科研或者工作过程中涉及的模型分布式训练,可能一个资源平台往往会非常耗时,无法及时满足个人需求。在这里,我将就上一篇《初步了解TensorFlow框架学习》提到的九天毕昇平台的使用进行一个具体的拓展,来方便学生和用户来更快捷地进行模型训练。该平台可以进行数据管理,模型训练等任务,是一个方便快捷的科研任务实践平台。在模型训练中具体操作步骤为:
(1)注册并登录九天毕昇平台,由于后续训练任务需消耗算力豆,而新用户的算力豆数量有限,但可以通过分享好友等任务来完成算力豆的获取。同时针对大型模型训练任务,为获取更多的模型训练存储空间,可邮件方式联系该平台的工作人员进行了控制台的升级,从而达到了日后所需的训练存储要求。存储和算力豆详情如下图:
(2)进入数据管理界面部署科研项目模型使用的数据集,通过将科研任务所需的数据集进行打包上传,完成模型训练所需数据集在该平台上的部署。
(3)在模型训练窗口新增项目训练实例,选择之前导入的数据集和所需的CPU资源。创建后的实例即为科研所需要训练的单个模型文件。新增项目实例的详情如下图所示:
(4)运行新增的项目实例,即运行项目训练环境,运行成功后,则可以选择jupyter编辑器创建和编辑所需的代码文件。
(5)后续代码编写和模型训练即可使用jupyter编辑器进行操作即可。
2. 图像分类技术拓展
图像分类,顾名思义就是根据图像之间差异性来对不同图像进行类别判断。而针对图像之间地差异性去设计判别模型就是机器学习中需要去掌握的知识。图像分类的基本知识和操作过程可以参考中国大学MOOC上的《TensorFlow入门实操课程》,快速了解TensorFlow基础应用与设计思路。。https://www.php.cn/link/b977b532403e14d6681a00f78f95506e
本章主要是想通过拓展图像分类技术来让接触该课程的用户更加深入地理解图像分类。
2.1 卷积操作有什么用?
说到对图像进行处理或者分类,必然绕不开一个操作,这个操作就是卷积。具体的卷积操作通过学习视频基本都能了解,但是更多的读者可能也只是停留在会如何进行卷积操作的程度上,而对于为什么去进行卷积,卷积操作有什么用这些仍然是一知半解。这里为大家进行一定拓展来帮助大家更好理解卷积。
基本的卷积过程下图所示,以图像为例,使用一个矩阵来表示图像,矩阵的每个元素即为图像中对应的像素值。卷积操作就是通过将卷积核逐乘对应的矩阵,从而得到这些小区域的特征值。而提取到的特征会因为卷积核的不同而有所差异,这也是后续会有人对图像不同通道进行卷积操作来获取图像不同通道的特征,来更好地进行后续分类任务。
在日常地模型训练中,具体地卷积核并不需要进行人工设计,而是通过给定图像的真实标签,使用网络来自动训练出来的,但是这样的过程不利于人们去理解卷积核和卷积过程,或者说不直观。因此为了帮助大家更好理解卷积操作的意义,在这举一个卷积操作的例子。如下图矩阵所示,数值表示图形的像素,为了方便计算,在这里只取了0和1, 不难看出该矩阵图形的特点上面一半图形是明亮的,下面一半图形是黑的,因此该图像具有很清晰的一道分界线,即具有很明显的水平特征。
因此为了很好地提取上述矩阵的水平特征,设计的卷积核应该也要具有水平特征提取的属性。而采用垂直特征提取属性的卷积核相对而言在特征提取的明显程度上会略显不足。 如下所示,采用提取水平特征的卷积核进行卷积:
由得到的卷积结果矩阵可知,原始图形的水平特征被很好地提取出来,并且图形地分界线会更加明显,因为图形有颜色的部分像素值加深了,很好地提取并突出了图形的水平特征。当采用提取垂直特征的卷积核进行卷积时:
由得到的卷积结果矩阵可知,原始图形的水平特征也能被提取出来,但是会产生两条分界线,图形变化由特别明亮到明亮再到黑,反映到真实图形上的情况也就变成由明到暗再到黑的情况,与真实原始图形反应的水平特征有所差别。
由上述例子不难得知,卷积核的不同会影响最终提取的图形特征的优劣程度,同时不同图形所反应出来的特征也有所不同,如何根据图形特征属性的不同来设计出网络模型来更好地学习和设计出卷积核也尤为关键。在实际地图形分类项目中,就需要根据图像的差异来选择提取合适的特征,并且往往需要有所取舍的去考虑。
2.2 如何考虑卷积来更好的进行图像分类?
在上一节中通过卷积操作的作用可以知道,设计网络模型来更好地去学习出适配图像的卷积核尤为重要。但在实际应用中,都是通过给定图像类别的真实标签,将类别标签转成机器能够理解的向量数据,来自动学习训练。当然,也不是完全无法通过人工设置来改善的。虽然数据集的标签是固定好的,但是我们可以根据数据集的图片类型去选择不同的网络模型,针对不同的网络模型的优劣势去考虑往往会有不错的训练效果。
同时在提取图像特征时,也可以考虑使用多任务学习的方法,在已有的图像数据中,再次同样使用一次图像数据去提取一些额外的图像特征(例如图像的通道特征和空间特征等),然后对之前提取到的特征进行一个补充或者填充,来完善最终提取到的图像特征。当然,有时候这种操作会造成提取的特征冗余,取得的分类效果往往适得其反,因此需要根据实际训练的分类结果去酌情考量。
2.3 网络模型选择的一些建议
图像分类领域发展已经有很长一段时间了,从最初经典的AlexNet网络模型到近几年火热的ResNet网络模型等,图像分类技术已经发展地比较完善,对于一些常用的图像数据集的分类准确率已经趋于100%。目前该领域中,大多数人采用的网络模型都是选择最新的,并且在大多数图像分类任务中,使用最新的网络模型确实可以带来很明显的分类效果,由此很多人在这一领域中往往会忽略以前的网络模型,直接去学习最新的、流行的网络模型。
在这,本人还是建议各位读者能够对图形分类领域的一些经典的网络模型都需要去进行一个熟悉,因为技术的更新迭代是非常快的,即使现在最新的网络模型今后也可能会被淘汰,但是基本的网络模型运行的原理是大致相通的,通过掌握经典的网络模型,不仅可以掌握基本的原理,还可以明白不同网络模型之间的差异和针对不同任务处理时的优劣性。例如,当你的图像数据集比较小时,采用最新的网络模型训练起来可能会非常复杂耗时,但是提升的效果微乎其微,因此为了可以忽略不计的效果去牺牲自己的训练时间成本反而得不偿失。因此,对于图像分类网络模型的掌握需要做到知其然还能知其所以然,这样今后选择图像分类模型时真正能做到有的放矢。
作者介绍:
稀饭,51CTO社区编辑,曾任职某电商人工智能研发中心大数据技术部门,做推荐算法。目前从事自然语言处理方向研究,主要擅长领域有推荐算法、NLP、CV,使用代码语言有Java、Python、Scala。发表ICCC会议论文一篇。
以上是TensorFlow应用技术拓展—图像分类的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

从主屏幕中删除了重要内容并试图将其取回?您可以通过多种方式将应用程序图标放回屏幕。我们已经讨论了您可以遵循的所有方法,并将应用程序图标放回主屏幕如何在iPhone中撤消从主屏幕中删除正如我们之前提到的,有几种方法可以在iPhone上恢复此更改。方法1–替换应用程序库中的应用程序图标您可以直接从应用程序库将应用程序图标放置在主屏幕上。第1步–横向滑动以查找应用程序库中的所有应用程序。步骤2–找到您之前删除的应用程序图标。步骤3–只需将应用程序图标从主库拖动到主屏幕上的正确位置即可。这是将应用程序图

PHP中箭头符号的作用及实践应用在PHP中,箭头符号(->)通常用于访问对象的属性和方法。对象是PHP中面向对象编程(OOP)的基本概念之一,在实际开发中,箭头符号在操作对象时发挥着重要作用。本文将介绍箭头符号的作用以及实践应用,并提供具体的代码示例来帮助读者更好地理解。一、箭头符号的作用访问对象的属性箭头符号可以用来访问对象的属性。当我们实例化一个对

这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致分为两种策略:2D到3D和3D到2D转换。2D到3D的方法通过预测深度概率来提升密集的2D特征,但深度预测的固有不确定性,尤其是在远处区域,可能会引入不准确性。而3D到2D的方法通常使用3D查询来采样2D特征,并通过Transformer学习3D和2D特征之间对应关系的注意力权重,这增加了计算和部署的

Linuxtee命令是一个非常有用的命令行工具,它可以在不影响已有输出的情况下,将输出写入文件或者将输出送往另一个命令。在本文中,我们将深入探索Linuxtee命令的各种应用场景,从入门到精通。1.基本用法首先,我们来看一下tee命令的基本用法。tee命令的语法如下:tee[OPTION]...[FILE]...该命令会从标准输入读取数据,并将数据

Go语言是一种由Google开发的开源编程语言,于2007年首次发布。它被设计成一种简单易学、高效、并发性强的语言,受到越来越多开发者的青睐。本文将探索Go语言的优势,并介绍一些适合Go语言的应用场景,同时给出具体的代码示例。优势并发性强:Go语言内置支持轻量级线程——goroutine,能够很容易地实现并发编程。通过使用go关键字就可以启动goroutin

23年9月国防科大、京东和北理工的论文“DeepModelFusion:ASurvey”。深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。而大规模深度学习模型(例如LLM和基础模型)上的深度模型融合面临着一些挑战,包括高计算成本、高维参数空间、不同异构模型之间的干扰等。本文将现有的深度模型融合方法分为四类:(1)“模式连接”,通过一条损失减少的路径将权重空间中的解连接起来,以获得更好的模型融合初

写在前面&笔者的个人理解基于图像的3D重建是一项具有挑战性的任务,涉及从一组输入图像推断目标或场景的3D形状。基于学习的方法因其直接估计3D形状的能力而受到关注。这篇综述论文的重点是最先进的3D重建技术,包括生成新颖的、看不见的视图。概述了高斯飞溅方法的最新发展,包括输入类型、模型结构、输出表示和训练策略。还讨论了尚未解决的挑战和未来的方向。鉴于该领域的快速进展以及增强3D重建方法的众多机会,对算法进行全面检查似乎至关重要。因此,本研究对高斯散射的最新进展进行了全面的概述。(大拇指往上滑

OpenAI发布的GPT-4o模型无疑是一个巨大的突破,特别是在其能够处理多种输入媒介(文本、音频、图片)并生成相应输出方面。这种能力使得人机交互更加自然和直观,极大地提升了AI的实用性和可用性。GPT-4o的几个关键亮点包括:高度可扩展性、多媒体输入输出、自然语言理解能力的进一步提升等等。1.跨媒介输入/输出:GPT-4o+能够接受文本、音频和图片的任意组合作为输入,并直接生成这些媒介的输出。这打破了传统AI模型仅处理单一输入类型的限制,使得人机交互更加灵活和多样化。这一创新有助于推动智能助手
