Python图像处理【8】使用低通滤波器模糊图像
低通滤波器 (Low Pass Filter, LPF) 过滤了图像中的高频部分,并仅允许低频部分通过。因此,在图像上应用 LPF 会删除图像中的细节/边缘和噪声/离群值,此过程也称为图像模糊(或平滑),图像平滑可以作为复杂图像处理任务的预处理部分。在本节中,我们将学习如何使用不同类型的滤波器核执行图像卷积以模糊图像。
1. 频域中的不同类型的核与卷积 1.1 图像模糊分类图像模糊通常包含以下类型:
边缘模糊 (Edge) 这种类型的模糊通常通过卷积显式地应用于图像,例如线性滤波器核或高斯核等,使用这些滤波器核可以平滑/去除图像中不必要的细节/噪声。运动模糊 (Motion) 通常是由于相机在拍摄图像时抖动所产生的,也就是说,摄像机或被拍摄的对象处于移动状态。我们可以使用点扩展函数来模拟这种模糊。失焦模糊 (de-focus) 当相机拍摄的对象失焦时,会产生这种类型的模糊;我们可以使用模糊 (blur) 核来模拟这种模糊。接下来,我们创建以上三种不同类型的核,并将它们应用于图像以观察不同类型核处理图像后的结果。
1.2 使用不同核执行图像模糊(1) 我们首先定义函数 get_gaussian_edge_blur_kernel() 以返回 2D 高斯模糊核用于边缘模糊。该函数接受高斯标准差 ( σ σ σ) 以及创建 2D 核的大小(例如,sz = 15 将创建尺寸为 15x15 的核)作为函数的参数。如下所示,首先创建了一个 1D 高斯核,然后计算两个 1D 高斯核的外积返回 2D 核:
import numpy as np import numpy.fft as fp from skimage.io import imread from skimage.color import rgb2gray import matplotlib.pyplot as plt import cv2 def get_gaussian_edge_blur_kernel(sigma, sz=15): # First create a 1-D Gaussian kernel x = np.linspace(-10, 10, sz) kernel_1d = np.exp(-x**2/sigma**2) kernel_1d /= np.trapz(kernel_1d) # normalize the sum to 1.0 # create a 2-D Gaussian kernel from the 1-D kernel kernel_2d = kernel_1d[:, np.newaxis] * kernel_1d[np.newaxis, :] return kernel_2d(2) 接下来,定义函数 get_motion_blur_kernel() 以生成运动模糊核,得到给定长度且特定方向(角度)的线作为卷积核,以模拟输入图像的运动模糊效果:
def get_motion_blur_kernel(ln, angle, sz=15): kern = np.ones((1, ln), np.float32) angle = -np.pi*angle/180 c, s = np.cos(angle), np.sin(angle) A = np.float32([[c, -s, 0], [s, c, 0]]) sz2 = sz // 2 A[:,2] = (sz2, sz2) - np.dot(A[:,:2], ((ln-1)*0.5, 0)) kern = cv2.warpAffine(kern, A, (sz, sz), flags=cv2.INTER_CUBIC) return kern函数 get_motion_blur_kernel() 将模糊的长度和角度以及模糊核的尺寸作为参数,函数使用 OpenCV 的 warpaffine() 函数返回核矩阵(以矩阵中心为中点,使用给定长度和给定角度得到核)。
(3) 最后,定义函数 get_out_of_focus_kernel() 以生成失焦核(模拟图像失焦模糊),其根据给定半径创建圆用作卷积核,该函数接受半径 R (Deocus Radius) 和要生成的核大小作为输入参数:
def get_out_of_focus_kernel(r, sz=15): kern = np.zeros((sz, sz), np.uint8) cv2.circle(kern, (sz, sz), r, 255, -1, cv2.LINE_AA, shift=1) kern = np.float32(kern) / 255 return kern(4) 接下来,实现函数 dft_convolve(),该函数使用图像的逐元素乘法和频域中的卷积核执行频域卷积(基于卷积定理)。该函数还绘制输入图像、核和卷积计算后得到的输出图像:
def dft_convolve(im, kernel): F_im = fp.fft2(im) #F_kernel = fp.fft2(kernel, s=im.shape) F_kernel = fp.fft2(fp.ifftshift(kernel), s=im.shape) F_filtered = F_im * F_kernel im_filtered = fp.ifft2(F_filtered) cmap = 'RdBu' plt.figure(figsize=(20,10)) plt.gray() plt.subplot(131), plt.imshow(im), plt.axis('off'), plt.title('input image', size=10) plt.subplot(132), plt.imshow(kernel, cmap=cmap), plt.title('kernel', size=10) plt.subplot(133), plt.imshow(im_filtered.real), plt.axis('off'), plt.title('output image', size=10) plt.tight_layout() plt.show()(5) 将 get_gaussian_edge_blur_kernel() 核函数应用于图像,并绘制输入,核和输出模糊图像:
im = rgb2gray(imread('3.png')) kernel = get_gaussian_edge_blur_kernel(25, 25) dft_convolve(im, kernel)(6) 接下来,将 get_motion_blur_kernel() 函数应用于图像,并绘制输入,核和输出模糊图像:
kernel = get_motion_blur_kernel(30, 60, 25) dft_convolve(im, kernel)(7) 最后,将 get_out_of_focus_kernel() 函数应用于图像,并绘制输入,核和输出模糊图像:
kernel = get_out_of_focus_kernel(15, 20) dft_convolve(im, kernel) 2. 使用 scipy.ndimage 滤波器模糊图像scipy.ndimage 模块提供了一系列可以在频域中对图像应用低通滤波器的函数。本节中,我们通过几个示例学习其中一些滤波器的用法。
2.1 使用 fourier_gaussian() 函数使用 scipy.ndimage 库中的 fourier_gaussian() 函数在频域中使用高斯核执行卷积操作。
(1) 首先,读取输入图像,并将其转换为灰度图像,并通过使用 FFT 获取其频域表示:
import numpy as np import numpy.fft as fp from skimage.io import imread import matplotlib.pyplot as plt from scipy import ndimage im = imread('1.png', as_gray=True) freq = fp.fft2(im)(2) 接下来,使用 fourier_gaussian() 函数对图像执行模糊操作,使用两个具有不同标准差的高斯核,绘制输入、输出图像以及功率谱:
fig, axes = plt.subplots(2, 3, figsize=(20,15)) plt.subplots_adjust(0,0,1,0.95,0.05,0.05) plt.gray() # show the filtered result in grayscale axes[0, 0].imshow(im), axes[0, 0].set_title('Original Image', size=10) axes[1, 0].imshow((20*np.log10( 0.1 + fp.fftshift(freq))).real.astype(int)), axes[1, 0].set_title('Original Image Spectrum', size=10) i = 1 for sigma in [3,5]: convolved_freq = ndimage.fourier_gaussian(freq, sigma=sigma) convolved = fp.ifft2(convolved_freq).real # the imaginary part is an artifact axes[0, i].imshow(convolved) axes[0, i].set_title(r'Output with FFT Gaussian Blur, $\sigma$={}'.format(sigma), size=10) axes[1, i].imshow((20*np.log10( 0.1 + fp.fftshift(convolved_freq))).real.astype(int)) axes[1, i].set_title(r'Spectrum with FFT Gaussian Blur, $\sigma$={}'.format(sigma), size=10) i += 1 for a in axes.ravel(): a.axis('off') plt.show()从上图中可以看出,高斯核的标准差 σ σ σ 值越大,输出图像就会越模糊。
2.2 使用 fourier_uniform() 函数scipy.ndimage 模块的函数 fourier_uniform() 实现了多维均匀傅立叶滤波器。频率阵列与给定尺寸的方形核的傅立叶变换相乘。接下来,我们学习如何使用 LPF (均值滤波器)模糊输入灰度图像。
(1) 首先,读取输入图像并使用 DFT 获取其频域表示:
im = imread('1.png', as_gray=True) freq = fp.fft2(im)(2) 然后,使用函数 fourier_uniform() 应用 10x10 方形核(由功率谱上的参数指定),以获取平滑输出:
freq_uniform = ndimage.fourier_uniform(freq, size=10)(3) 绘制原始输入图像和模糊后的图像:
fig, (axes1, axes2) = plt.subplots(1, 2, figsize=(20,10)) plt.gray() # show the result in grayscale im1 = fp.ifft2(freq_uniform) axes1.imshow(im), axes1.axis('off') axes1.set_title('Original Image', size=10) axes2.imshow(im1.real) # the imaginary part is an artifact axes2.axis('off') axes2.set_title('Blurred Image with Fourier Uniform', size=10) plt.tight_layout() plt.show()(4) 最后,绘制显示方形核的功率谱:
plt.figure(figsize=(10,10)) plt.imshow( (20*np.log10( 0.1 + fp.fftshift(freq_uniform))).real.astype(int)) plt.title('Frequency Spectrum with fourier uniform', size=10) plt.show() 2.3 使用 fourier_ellipsoid() 函数与上一小节类似,通过将方形核修改为椭圆形核,我们可以使用椭圆形核生成模糊的输出图像。
(1) 类似的,我们首先在图像的功率谱上应用函数 fourier_ellipsoid(),并使用 IDFT 在空间域中获得模糊后的输出图像:
freq_ellipsoid = ndimage.fourier_ellipsoid(freq, size=10) im1 = fp.ifft2(freq_ellipsoid)(2) 接下来,绘制原始输入图像和模糊后的图像:
fig, (axes1, axes2) = plt.subplots(1, 2, figsize=(20,10)) axes1.imshow(im), axes1.axis('off') axes1.set_title('Original Image', size=10) axes2.imshow(im1.real) # the imaginary part is an artifact axes2.axis('off') axes2.set_title('Blurred Image with Fourier Ellipsoid', size=10) plt.tight_layout() plt.show()(3) 最后,显示应用椭圆形核后图像的频谱:
plt.figure(figsize=(10,10)) plt.imshow( (20*np.log10( 0.1 + fp.fftshift(freq_ellipsoid))).real.astype(int)) plt.title('Frequency Spectrum with Fourier ellipsoid', size=10) plt.show() 3. 使用 scipy.fftpack 实现高斯模糊我们已经学习了如何在实际应用中使用 numpy.fft 模块的 2D-FFT。在本节中,我们将介绍 scipy.fftpack 模块的 fft2() 函数用于实现高斯模糊。
(1) 使用灰度图像作为输入,并使用 FFT 从图像中创建 2D 频率响应数组:
import numpy as np import numpy.fft as fp from skimage.color import rgb2gray from skimage.io import imread import matplotlib.pyplot as plt from scipy import signal from matplotlib.ticker import LinearLocator, FormatStrFormatter im = rgb2gray(imread('1.png')) freq = fp.fft2(im)(2) 通过计算两个 1D 高斯核的外积,在空间域中创建高斯 2D 核用作 LPF:
kernel = np.outer(signal.gaussian(im.shape[0], 1), signal.gaussian(im.shape[1], 1))(3) 使用 DFT 获得高斯核的频率响应:
freq_kernel = fp.fft2(fp.ifftshift(kernel))(4) 使用卷积定理通过逐元素乘法在频域中将 LPF 与输入图像卷积:
convolved = freq*freq_kernel # by the Convolution theorem(5) 使用 IFFT 获得输出图像,需要注意的是,要正确显示输出图像,需要缩放输出图像:
im_blur = fp.ifft2(convolved).real im_blur = 255 * im_blur / np.max(im_blur)(6) 绘制图像、高斯核和在频域中卷积后获得图像的功率谱,可以使用 matplotlib.colormap 绘制色,以了解不同坐标下的频率响应值:
plt.figure(figsize=(20,20)) plt.subplot(221), plt.imshow(kernel, cmap='coolwarm'), plt.colorbar() plt.title('Gaussian Blur Kernel', size=10) plt.subplot(222) plt.imshow( (20*np.log10( 0.01 + fp.fftshift(freq_kernel))).real.astype(int), cmap='inferno') plt.colorbar() plt.title('Gaussian Blur Kernel (Freq. Spec.)', size=10) plt.subplot(223), plt.imshow(im, cmap='gray'), plt.axis('off'), plt.title('Input Image', size=10) plt.subplot(224), plt.imshow(im_blur, cmap='gray'), plt.axis('off'), plt.title('Output Blurred Image', size=10) plt.tight_layout() plt.show()(7) 要绘制输入/输出图像和 3D 核的功率谱,我们定义函数 plot_3d(),使用 mpl_toolkits.mplot3d 模块的 plot_surface() 函数获取 3D 功率谱图,给定相应的 Y 和Z值作为 2D 阵列传递:
def plot_3d(X, Y, Z, cmap=plt.cm.seismic): fig = plt.figure(figsize=(20,20)) ax = fig.gca(projection='3d') # Plot the surface. surf = ax.plot_surface(X, Y, Z, cmap=cmap, linewidth=5, antialiased=False) #ax.plot_wireframe(X, Y, Z, rstride=10, cstride=10) #ax.set_zscale("log", nonposx='clip') #ax.zaxis.set_scale('log') ax.zaxis.set_major_locator(LinearLocator(10)) ax.zaxis.set_major_formatter(FormatStrFormatter('%.02f')) ax.set_xlabel('F1', size=15) ax.set_ylabel('F2', size=15) ax.set_zlabel('Freq Response', size=15) #ax.set_zlim((-40,10)) # Add a color bar which maps values to colors. fig.colorbar(surf) #, shrink=0.15, aspect=10) #plt.title('Frequency Response of the Gaussian Kernel') plt.show()(8) 在 3D 空间中绘制高斯核的频率响应,并使用 plot_3d() 函数:
Y = np.arange(freq.shape[0]) #-freq.shape[0]//2,freq.shape[0]-freq.shape[0]//2) X = np.arange(freq.shape[1]) #-freq.shape[1]//2,freq.shape[1]-freq.shape[1]//2) X, Y = np.meshgrid(X, Y) Z = (20*np.log10( 0.01 + fp.fftshift(freq_kernel))).real plot_3d(X,Y,Z)下图显示了 3D 空间中高斯 LPF 核的功率谱:
(9) 绘制 3D 空间中输入图像的功率谱:
Z = (20*np.log10( 0.01 + fp.fftshift(freq))).real plot_3d(X,Y,Z)(10) 最后,绘制输出图像的功率谱(通过将高斯核与输入图像卷积获得):
Z = (20*np.log10( 0.01 + fp.fftshift(convolved))).real plot_3d(X,Y,Z)从输出图像的频率响应中可以看出,高频组件被衰减,从而导致细节的平滑/丢失,并导致输出图像模糊。
4. 彩色图像频域卷积在本节中,我们将学习使用 scipy.signal 模块的 fftconvolve() 函数,用于与 RGB 彩色输入图像进行频域卷积,从而生成 RGB 彩色模糊输出图像:
scipy.signal.fftconvolve(in1, in2, mode='full', axes=None)函数使用 FFT 卷积两个 n 维数组 in1 和 in2,并由 mode 参数确定输出大小。卷积模式 mode 具有以下类型:
输出是输入的完全离散线性卷积,默认情况下使用此种卷积模式输出仅由那些不依赖零填充的元素组成,in1 或 in2 的尺寸必须相同输出的大小与 in1 相同,并以输出为中心 4.1 基于 scipy.signal 模块的彩色图像频域卷积接下来,我们实现高斯低通滤波器并使用 Laplacian 高通滤波器执行相应操作。
(1) 首先,导入所需的包,并读取输入 RGB 图像:
from skimage import img_as_float from scipy import signal import numpy as np import matplotlib.pyplot as plt im = img_as_float(plt.imread('1.png'))(2) 实现函数 get_gaussian_edge_kernel(),并根据此函数创建一个尺寸为 15x15 的高斯核:
def get_gaussian_edge_blur_kernel(sigma, sz=15): # First create a 1-D Gaussian kernel x = np.linspace(-10, 10, sz) kernel_1d = np.exp(-x**2/sigma**2) kernel_1d /= np.trapz(kernel_1d) # normalize the sum to 1.0 # create a 2-D Gaussian kernel from the 1-D kernel kernel_2d = kernel_1d[:, np.newaxis] * kernel_1d[np.newaxis, :] return kernel_2d kernel = get_gaussian_edge_blur_kernel(sigma=10, sz=15)(3) 然后,使用 np.newaxis 将核尺寸重塑为 15x15x1,并使用 same 模式调用函数 signal.fftconvolve():
im1 = signal.fftconvolve(im, kernel[:, :, np.newaxis], mode='same') im1 = im1 / np.max(im1)在以上代码中使用的 mode='same',可以强制输出形状与输入阵列形状相同,以避免边框效应。
(4) 接下来,使用 laplacian HPF 内核,并使用相同函数执行频域卷积。需要注意的是,我们可能需要缩放/裁剪输出图像以使输出值保持像素的浮点值范围 [0,1] 内:
kernel = np.array([[0,-1,0],[-1,4,-1],[0,-1,0]]) im2 = signal.fftconvolve(im, kernel[:, :, np.newaxis], mode='same') im2 = im2 / np.max(im2) im2 = np.clip(im2, 0, 1)(5) 最后,绘制输入图像和使用卷积创建的输出图像。
plt.figure(figsize=(20,10)) plt.subplot(131), plt.imshow(im), plt.axis('off'), plt.title('original image', size=10) plt.subplot(132), plt.imshow(im1), plt.axis('off'), plt.title('output with Gaussian LPF', size=10) plt.subplot(133), plt.imshow(im2), plt.axis('off'), plt.title('output with Laplacian HPF', size=10) plt.tight_layout() plt.show()如上图所示,高斯 LPF 可以用于模糊图像,而拉普拉斯 HPF 则可以用于提取图像中的细节/边缘(这些部分对应于图像中的高频分量)。
小结在图像上应用低通滤波器会删除图像中的细节/边缘和噪声/离群值,称为图像模糊(或平滑),图像平滑可以作为复杂图像处理任务的预处理部分。在本节中,我们介绍了多种不同类型的滤波器核与卷积操作,使用 scipy.ndimage 模块中的滤波器模糊图像,利用 scipy.fftpack 模块的 fft2() 函数实现高斯模糊,还介绍了基于 scipy.signal 模块的彩色图像频域卷积。
系列链接Python图像处理【1】图像与视频处理基础 Python图像处理【2】探索Python图像处理库 Python图像处理【3】Python图像处理库应用 Python图像处理【4】图像线性变换 Python图像处理【5】图像扭曲/逆扭曲 Python图像处理【6】通过哈希查找重复和类似的图像 Python图像处理【7】采样、卷积与离散傅里叶变换