画像処理は、ソーシャル メディアや医療画像処理などのさまざまな分野に関与し、私たちの日常生活に不可欠な要素となっています。デジタル カメラや衛星写真や医療スキャンなどの他のソースから取得した画像には、ノイズを除去または強調するための前処理が必要な場合があります。周波数領域フィルタリングは、画像の鮮鋭化を強化しながらノイズを除去できるソリューションとして考えられます。
高速フーリエ変換 (FFT) は、画像を空間領域から周波数領域に変換する数学的手法であり、画像処理における周波数変換の重要なツールです。画像の周波数領域表現を活用することで、その周波数成分に基づいて画像を効果的に分析できるため、ノイズを除去するためのフィルタリング手順の適用が簡素化されます。この記事では、FFT シフトと逆 FFT シフトの使用を組み合わせた、FFT から逆 FFT への画像の周波数変換に含まれるさまざまな段階について説明します。
この記事では、openCV、Numpy、Matplotlib という 3 つの Python ライブラリを使用します。
import cv2 import numpy as np from matplotlib import pyplot as plt img = cv2.imread('sample.png',0) # Using 0 to read image in grayscale mode plt.imshow(img, cmap='gray')#cmap is used to specify imshow that the image is in greyscale plt.xticks([]), plt.yticks([])# remove tick marks plt.show()
高速フーリエ変換 (FFT) は、画像を空間領域から周波数領域に変換できるようにする広く使用されている数学的手法であり、周波数変換の基本コンポーネントです。 FFT 解析を使用すると、画像の周期性を取得してさまざまな周波数成分に分割し、各画像のそれぞれの周波数成分の振幅と位相を表示する画像スペクトルを生成できます。
f = np.fft.fft2(img)#the image 'img' is passed to np.fft.fft2() to compute its 2D Discrete Fourier transform f mag = 20*np.log(np.abs(f)) plt.imshow(mag, cmap = 'gray') #cmap='gray' parameter to indicate that the image should be displayed in grayscale. plt.title('Magnitude Spectrum') plt.xticks([]), plt.yticks([]) plt.show()
上記のコードは、np.abs() を使用してフーリエ変換 f の振幅を計算します。np.log( ) 対数スケールに変換し、20 を乗じて振幅をデシベル単位で取得します。これは、振幅スペクトルの視覚化と解釈を容易にするために行われます。
フィルター アルゴリズムを画像に適用するには、FFT シフトを使用して画像のゼロ周波数成分をスペクトルの中心に移動します
fshift = np.fft.fftshift(f) mag = 20*np.log(np.abs(fshift)) plt.imshow(mag, cmap = 'gray') plt.title('Centered Spectrum'), plt.xticks([]), plt.yticks([]) plt.show()
import math def distance(point1,point2): return math.sqrt((point1[0]-point2[0])**2 + (point1[1]-point2[1])**2) def idealFilterLP(D0,imgShape): base = np.zeros(imgShape[:2]) rows, cols = imgShape[:2] center = (rows/2,cols/2) for x in range(cols): for y in range(rows): if distance((y,x),center) < D0: base[y,x] = 1 return base def idealFilterHP(D0,imgShape): base = np.ones(imgShape[:2]) rows, cols = imgShape[:2] center = (rows/2,cols/2) for x in range(cols): for y in range(rows): if distance((y,x),center) < D0: base[y,x] = 0 return base
次の関数は、必要な円形マスクを使用してガウス ハイパス フィルターとローパス フィルターを生成します
import math def distance(point1,point2): return math.sqrt((point1[0]-point2[0])**2 + (point1[1]-point2[1])**2) def gaussianLP(D0,imgShape): base = np.zeros(imgShape[:2]) rows, cols = imgShape[:2] center = (rows/2,cols/2) for x in range(cols): for y in range(rows): base[y,x] = math.exp(((-distance((y,x),center)**2)/(2*(D0**2)))) return base def gaussianHP(D0,imgShape): base = np.zeros(imgShape[:2]) rows, cols = imgShape[:2] center = (rows/2,cols/2) for x in range(cols): for y in range(rows): base[y,x] = 1 - math.exp(((-distance((y,x),center)**2)/(2*(D0**2)))) return base
fig, ax = plt.subplots(2, 2) # create a 2x2 grid of subplots fig.suptitle('Filters') # set the title for the entire figure # plot the first image in the top-left subplot im1 = ax[0, 0].imshow(np.abs(idealFilterLP(50, img.shape)), cmap='gray') ax[0, 0].set_title('Low Pass Filter of Diameter 50 px') ax[0, 0].set_xticks([]) ax[0, 0].set_yticks([]) # plot the second image in the top-right subplot im2 = ax[0, 1].imshow(np.abs(idealFilterHP(50, img.shape)), cmap='gray') ax[0, 1].set_title('High Pass Filter of Diameter 50 px') ax[0, 1].set_xticks([]) ax[0, 1].set_yticks([]) # plot the third image in the bottom-left subplot im3 = ax[1, 0].imshow(np.abs(gaussianLP(50 ,img.shape)), cmap='gray') ax[1, 0].set_title('Gaussian Filter of Diameter 50 px') ax[1, 0].set_xticks([]) ax[1, 0].set_yticks([]) # plot the fourth image in the bottom-right subplot im4 = ax[1, 1].imshow(np.abs(gaussianHP(50 ,img.shape)), cmap='gray') ax[1, 1].set_title('Gaussian Filter of Diameter 50 px') ax[1, 1].set_xticks([]) ax[1, 1].set_yticks([]) # adjust the spacing between subplots fig.subplots_adjust(wspace=0.5, hspace=0.5) # save the figure to a file fig.savefig('filters.png', bbox_inches='tight')
g(x,y) = ∑∑ f(m,n)h(x-m,y-n)
fig, ax = plt.subplots() im = ax.imshow(np.log(1+np.abs(fftshifted_image * idealFilterLP(50,img.shape))), cmap='gray') ax.set_title('Filtered Image in Frequency Domain') ax.set_xticks([]) ax.set_yticks([]) fig.savefig('filtered image in freq domain.png', bbox_inches='tight')
一般情况下会使用Np.log (1+np.abs(x)),因为它通过压缩数据的动态范围来帮助更清晰地可视化频谱。这是通过取数据绝对值的对数来实现的,并加上1以避免取零的对数。
fig, ax = plt.subplots() im = ax.imshow(np.log(1+np.abs(np.fft.ifftshift(fftshifted_image * idealFilterLP(50,img.shape)))), cmap='gray') ax.set_title('Filtered Image inverse fft shifted') ax.set_xticks([]) ax.set_yticks([]) fig.savefig('filtered image inverse fft shifted.png', bbox_inches='tight')
fig, ax = plt.subplots() im = ax.imshow(np.log(1+np.abs(np.fft.ifft2(np.fft.ifftshift(fftshifted_image * idealFilterLP(50,img.shape))))), cmap='gray') ax.set_title('Final Filtered Image In Spatial Domain') ax.set_xticks([]) ax.set_yticks([]) fig.savefig('final filtered image.png', bbox_inches='tight')
def Freq_Trans(image, filter_used): img_in_freq_domain = np.fft.fft2(image) # Shift the zero-frequency component to the center of the frequency spectrum centered = np.fft.fftshift(img_in_freq_domain) # Multiply the filter with the centered spectrum filtered_image_in_freq_domain = centered * filter_used # Shift the zero-frequency component back to the top-left corner of the frequency spectrum inverse_fftshift_on_filtered_image = np.fft.ifftshift(filtered_image_in_freq_domain) # Apply the inverse Fourier transform to obtain the final filtered image final_filtered_image = np.fft.ifft2(inverse_fftshift_on_filtered_image) return img_in_freq_domain,centered,filter_used,filtered_image_in_freq_domain,inverse_fftshift_on_filtered_image,final_filtered_image
fig, axs = plt.subplots(12, 7, figsize=(30, 60)) filters = [(f, d) for f in [idealFilterLP, idealFilterHP, gaussianLP, gaussianHP] for d in [50, 100, 150]] for row, (filter_name, filter_diameter) in enumerate(filters): # Plot each filter output on a separate subplot result = Freq_Trans(img, filter_name(filter_diameter, img.shape)) for col, title, img_array in zip(range(7), ["Original Image", "Spectrum", "Centered Spectrum", f"{filter_name.__name__} of Diameter {filter_diameter} px", f"Centered Spectrum multiplied by {filter_name.__name__}", "Decentralize", "Processed Image"], [img, np.log(1+np.abs(result[0])), np.log(1+np.abs(result[1])), np.abs(result[2]), np.log(1+np.abs(result[3])), np.log(1+np.abs(result[4])), np.abs(result[5])]): axs[row, col].imshow(img_array, cmap='gray') axs[row, col].set_title(title) plt.tight_layout() plt.savefig('all_processess.png', bbox_inches='tight') plt.show()
一般に、ガウス フィルターはその滑らかさと堅牢性により、画像処理タスクでより一般的に使用されます。より鋭いカットオフが必要な一部のアプリケーションでは、理想的なフィルターの方が適している場合があります。
FFT を使用して画像周波数を変更することは、ノイズを低減し、画像の鮮明さを向上させる効果的な方法です。これには、FFT を使用して画像を周波数領域に変換し、適切な技術を使用してノイズをフィルタリングし、逆 FFT を使用して変更された画像を空間領域に変換することが含まれます。これらの技術を理解して実装することで、さまざまなアプリケーションの画質を向上させることができます。
