利用OpenCL对OpenCV并行化心得(2)
上文说到了没有ROI的情况下怎么优化add,现在看看有roi的情况。 ROI是opencv里面的一个特性,也可以说是图像处理库都有的特性,它的意思是对于整个一幅图像,只处理被ROI框起来的那一块,可以看做是一个mask。如果不注重性能,最简单的方法就是加上一个offse
上文说到了没有ROI的情况下怎么优化add,现在看看有roi的情况。
ROI是opencv里面的一个特性,也可以说是图像处理库都有的特性,它的意思是对于整个一幅图像,只处理被ROI框起来的那一块,可以看做是一个mask。如果不注重性能,最简单的方法就是加上一个offset即可
__kernel void matrix_add(__global uchar* src1,__global uchar* src2, __global uchar* dst, int rows, int cols,int src1_step,int src2_step,int dst_step,int src1_offset, int src2_offset, int dst_offset)
{
int x=get_global_id(0);
int y=get_global_id(1);
if(x
dst[mad24(y,dst_step,x+dst_offset)]=src1[mad24(y,src1t_step,x+src1_offset)]+src2[mad24(y,src2_step,x+src2_offset)];
}
但是在每次读4个点的时候不能这么做,因为这有对齐问题。比如一个矩阵是17列1行,ROI设置的是后16个点,起始地址就不会是4的整数倍,这样在指针强制转换的时候会出现未定义的情况,结果是错的。除此之外,长度不是4的倍数也会出现问题,所以要使用一些技巧。一个办法是可以先强制对齐地址,多读一些数据,判断是否是需要的,不是需要的就扔掉
__kernel void matrix_add (__global uchar *src1, int src1_step, int src1_offset,
__global uchar *src2, int src2_step, int src2_offset,
__global uchar *dst, int dst_step, int dst_offset,
int rows, int cols, int dst_step1)
{
int x = get_global_id(0);
int y = get_global_id(1);
if (x
{
x = x
#define dst_align (dst_offset & 3)
int src1_index = mad24(y, src1_step, x + src1_offset - dst_align);
int src2_index = mad24(y, src2_step, x + src2_offset - dst_align);
int dst_start = mad24(y, dst_step, dst_offset);
int dst_end = mad24(y, dst_step, dst_offset + dst_step1);
int dst_index = mad24(y, dst_step, dst_offset + x & (int)0xfffffffc);
uchar4 src1_data = vload4(0, src1 + src1_index);
uchar4 src2_data = vload4(0, src2 + src2_index);
uchar4 dst_data = *((__global uchar4 *)(dst + dst_index));
short4 tmp = convert_short4_sat(src1_data) + convert_short4_sat(src2_data);
uchar4 tmp_data = convert_uchar4_sat(tmp);
dst_data.x = ((dst_index + 0 >= dst_start) && (dst_index + 0
dst_data.y = ((dst_index + 1 >= dst_start) && (dst_index + 1
dst_data.z = ((dst_index + 2 >= dst_start) && (dst_index + 2
dst_data.w = ((dst_index + 3 >= dst_start) && (dst_index + 3
*((__global uchar4 *)(dst + dst_index)) = dst_data;
}
}

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

使用pip命令轻松安装OpenCV教程,需要具体代码示例OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉库,它包含了大量的计算机视觉算法和函数,可以帮助开发者快速构建图像和视频处理相关的应用程序。在使用OpenCV之前,我们需要先安装它。幸运的是,Python提供了一个强大的工具pip来管理第三方库

如何利用GitLab进行项目文档管理一、背景介绍在软件开发过程中,项目文档是非常重要的资料,不仅能够帮助开发团队了解项目的需求和设计,还能提供给测试团队和客户参考。为了方便项目文档的版本控制和团队协作,我们可以利用GitLab来进行项目文档管理。GitLab是一个基于Git的版本控制系统,除了支持代码管理,还可以管理项目文档。二、GitLab环境搭建首先,我

OpenCV是一种用于计算机视觉和图像处理的开源库,广泛应用于机器学习、图像识别、视频处理等领域。在使用OpenCV进行开发时,为了能够更好地调试和运行程序,很多开发者选择使用PyCharm这款强大的Python集成开发环境。本文将为PyCharm用户提供OpenCV的安装教程,并附上具体的代码示例。第一步:安装Python首先,确保您已经安装了Python

JavaOpenCV库的org.opencv.imgproc包包含一个名为Imgproc的类,该类提供了各种方法来处理输入图像。它提供了一组在图像上绘制几何形状的方法。要绘制一个带箭头的线条,您需要调用这个类的arrowedLine()方法。该方法接受以下参数:表示要在其上绘制线条的图像的Mat对象。表示线条之间的两个点的Point对象。drawn.表示线条颜色的Scalar对象。(BGR)表示线条厚度的整数(默认值:1)。示例importorg.opencv.core.Core;importo

如何使用PHP和OpenCV库实现视频处理?摘要:在现代科技应用中,视频处理已经成为一项重要的技术。本文将介绍如何使用PHP编程语言结合OpenCV库来实现一些基本的视频处理功能,并附上相应的代码示例。关键词:PHP、OpenCV、视频处理、代码示例引言:随着互联网的发展和智能手机的普及,视频内容已经成为人们生活中不可或缺的一部分。然而,要想实现视频的编辑和

计算机视觉(ComputerVision)是人工智能领域的重要分支之一,它可以使计算机能够自动地感知和理解图像、视频等视觉信号,实现人机交互以及自动化控制等应用场景。OpenCV(OpenSourceComputerVisionLibrary)是一个流行的开源计算机视觉库,在计算机视觉、机器学习、深度学习等领域都有广泛的应用。本文将介绍在PHP中使

C#中常见的性能调优和代码重构技巧及解决方法引言:在软件开发过程中,性能优化和代码重构是不可忽视的重要环节。特别是在使用C#开发大型应用程序时,优化和重构代码可以提升应用程序的性能和可维护性。本文将介绍一些常见的C#性能调优和代码重构技巧,并提供相应的解决方法和具体的代码示例。一、性能调优技巧:选择合适的集合类型:C#提供了多种集合类型,如List、Dict

如何使用PHP和OpenCV库实现图像锐化?概述:图像锐化是一种常见的图像处理技术,用于提高图像的清晰度和边缘的强度。在本文中,我们将介绍如何使用PHP和OpenCV库来实现图像锐化。OpenCV是一款功能强大的开源计算机视觉库,它提供了丰富的图像处理功能。我们将使用OpenCV的PHP扩展来实现图像锐化算法。步骤1:安装OpenCV和PHP扩展首先,我们需
