利用OpenCL对OpenCV并行化心得(2)
上文说到了没有ROI的情况下怎么优化add,现在看看有roi的情况。 ROI是opencv里面的一个特性,也可以说是图像处理库都有的特性,它的意思是对于整个一幅图像,只处理被ROI框起来的那一块,可以看做是一个mask。如果不注重性能,最简单的方法就是加上一个offse
上文说到了没有ROI的情况下怎么优化add,现在看看有roi的情况。
ROI是opencv里面的一个特性,也可以说是图像处理库都有的特性,它的意思是对于整个一幅图像,只处理被ROI框起来的那一块,可以看做是一个mask。如果不注重性能,最简单的方法就是加上一个offset即可
__kernel void matrix_add(__global uchar* src1,__global uchar* src2, __global uchar* dst, int rows, int cols,int src1_step,int src2_step,int dst_step,int src1_offset, int src2_offset, int dst_offset)
{
int x=get_global_id(0);
int y=get_global_id(1);
if(x
dst[mad24(y,dst_step,x+dst_offset)]=src1[mad24(y,src1t_step,x+src1_offset)]+src2[mad24(y,src2_step,x+src2_offset)];
}
但是在每次读4个点的时候不能这么做,因为这有对齐问题。比如一个矩阵是17列1行,ROI设置的是后16个点,起始地址就不会是4的整数倍,这样在指针强制转换的时候会出现未定义的情况,结果是错的。除此之外,长度不是4的倍数也会出现问题,所以要使用一些技巧。一个办法是可以先强制对齐地址,多读一些数据,判断是否是需要的,不是需要的就扔掉
__kernel void matrix_add (__global uchar *src1, int src1_step, int src1_offset,
__global uchar *src2, int src2_step, int src2_offset,
__global uchar *dst, int dst_step, int dst_offset,
int rows, int cols, int dst_step1)
{
int x = get_global_id(0);
int y = get_global_id(1);
if (x
{
x = x
#define dst_align (dst_offset & 3)
int src1_index = mad24(y, src1_step, x + src1_offset - dst_align);
int src2_index = mad24(y, src2_step, x + src2_offset - dst_align);
int dst_start = mad24(y, dst_step, dst_offset);
int dst_end = mad24(y, dst_step, dst_offset + dst_step1);
int dst_index = mad24(y, dst_step, dst_offset + x & (int)0xfffffffc);
uchar4 src1_data = vload4(0, src1 + src1_index);
uchar4 src2_data = vload4(0, src2 + src2_index);
uchar4 dst_data = *((__global uchar4 *)(dst + dst_index));
short4 tmp = convert_short4_sat(src1_data) + convert_short4_sat(src2_data);
uchar4 tmp_data = convert_uchar4_sat(tmp);
dst_data.x = ((dst_index + 0 >= dst_start) && (dst_index + 0
dst_data.y = ((dst_index + 1 >= dst_start) && (dst_index + 1
dst_data.z = ((dst_index + 2 >= dst_start) && (dst_index + 2
dst_data.w = ((dst_index + 3 >= dst_start) && (dst_index + 3
*((__global uchar4 *)(dst + dst_index)) = dst_data;
}
}

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用pip命令輕鬆安裝OpenCV教程,需要具體程式碼範例OpenCV(OpenSourceComputerVisionLibrary)是一個開源的電腦視覺庫,它包含了大量的電腦視覺演算法和函數,可以幫助開發者快速建立圖像和視訊處理相關的應用程式。在使用OpenCV之前,我們需要先安裝它。幸運的是,Python提供了一個強大的工具pip來管理第三方函式庫

如何利用GitLab進行專案文件管理一、背景介紹在軟體開發過程中,專案文件是非常重要的資料,不僅能夠幫助開發團隊了解專案的需求和設計,還能提供給測試團隊和客戶參考。為了方便專案文件的版本控制和團隊協作,我們可以利用GitLab來進行專案文件管理。 GitLab是一個基於Git的版本控制系統,除了支援程式碼管理,還可以管理專案文件。二、GitLab環境建置首先,我

OpenCV是一種用於電腦視覺和影像處理的開源庫,廣泛應用於機器學習、影像辨識、視訊處理等領域。在使用OpenCV進行開發時,為了能夠更好地調試和運行程序,許多開發者選擇使用PyCharm這款強大的Python整合開發環境。本文將為PyCharm用戶提供OpenCV的安裝教學課程,並附上具體的程式碼範例。第一步:安裝Python首先,請確保您已經安裝了Python

JavaOpenCV函式庫的org.opencv.imgproc套件包含一個名為Imgproc的類,該類別提供了各種方法來處理輸入影像。它提供了一組在圖像上繪製幾何形狀的方法。要繪製一個帶有箭頭的線條,您需要呼叫這個類別的arrowedLine()方法。此方法接受以下參數:表示要在其上繪製線條的影像的Mat物件。表示線條之間的兩點的Point物件。 drawn.表示線條顏色的Scalar物件。 (BGR)表示線條厚度的整數(預設值:1)。範例importorg.opencv.core.Core;importo

如何使用PHP和OpenCV庫實現視訊處理?摘要:在現代科技應用中,視訊處理已成為一項重要的技術。本文將介紹如何使用PHP程式語言結合OpenCV函式庫來實作一些基本的視訊處理功能,並附上對應的程式碼範例。關鍵字:PHP、OpenCV、視訊處理、程式碼範例引言:隨著網路的發展和智慧型手機的普及,影片內容已成為人們生活中不可或缺的一部分。然而,要實現影片的編輯和

電腦視覺(ComputerVision)是人工智慧領域的重要分支之一,它可以使電腦能夠自動地感知和理解圖像、視訊等視覺訊號,實現人機互動以及自動化控制等應用場景。 OpenCV(OpenSourceComputerVisionLibrary)是一個受歡迎的開源電腦視覺庫,在電腦視覺、機器學習、深度學習等領域都有廣泛的應用。本文將介紹在PHP中使

C#中常見的效能調優與程式碼重構技巧及解決方法引言:在軟體開發過程中,效能最佳化和程式碼重構是不可忽視的重要環節。特別是在使用C#開發大型應用程式時,最佳化和重構程式碼可以提升應用程式的效能和可維護性。本文將介紹一些常見的C#效能調校和程式碼重構技巧,並提供相應的解決方法和具體的程式碼範例。一、效能調優技巧:選擇適合的集合類型:C#提供了多種集合類型,如List、Dict

PyCharm是一款由JetBrains公司開發的強大的Python整合開發環境(IDE),提供了豐富的功能和工具來幫助Python開發者編寫程式碼、除錯程式以及管理專案。在PyCharm中使用OpenCV這一強大的電腦視覺庫,可以輕鬆地進行影像處理、視訊處理等任務。本文將詳細介紹在PyCharm中安裝和設定OpenCV的步驟,並提供具體的程式碼範例。 1.安
