请我喝杯咖啡☕
计算机视觉是使计算机能够理解和分析图像、视频等视觉事物的技术。
计算机视觉技术有很多,如下所示:
(1) 分类(识别):
- 可以将整个图像、视频等从一个或多个类(标签)中分类为一个或多个类(标签)。
- 更具体可以称为图像分类(识别)、视频分类(识别)、物体分类(识别)等
- 有方法单标签分类,它有两种方法二元分类和多类分类。
- 有方法多标签分类。
*备忘录:
-
二元分类可以将整个图像、视频等从两个类(标签)中分类为单个类(标签)。
-
多类分类可以将整个图像、视频等从两个以上的类(标签)中分类为单个类(标签)。
-
多标签分类可以将整个图像、视频等从两个以上的类(标签)中分类为多个类(标签)。
(2) 本地化:
- 可以用边界框定位图像、视频等中的多个对象和感兴趣的区域。
- 可以更具体地称为图像本地化和视频本地化、对象本地化等
(3) 检测:
- 可以使用类(标签)和边界框对图像、视频等中的对象和感兴趣的区域进行本地化和分类。
- 是对象定位和分类(识别)的组合。
- 可以更具体地称为图像检测、视频检测、物体检测等
(4) 分割:
- 可以更精确地进行对象检测,用颜色区分东西和东西:
*备注:
-
东西是不可数的事物(类),例如天空、海洋、福雷斯特、道路、草地、风景等
-
事物是可数事物(类),例如车、树、人、动物、花等。
- 更具体可以称为图像分割和视频分割、对象分割等
- 有流行的方法语义分割、实例分割和全景分割:
*备注:
-
语义分割擅长区分事物,但不擅长区分事物。
-
实例分割擅长区分事物,但不擅长区分事物。
-
全景分割:
- 擅长区分东西和东西。
- 是语义分割和实例分割的组合。
以上是什么是计算机视觉? (1)的详细内容。更多信息请关注PHP中文网其他相关文章!