包括图像缩放、图像平移、图像旋转、图像的仿射变换、图像的透射变换及图像金字塔等内容。
图像缩放:
图像平移:
图像旋转:
图像的仿射变换:
图像的透射变换:
图像金字塔:
图像金字塔是图像多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。
图像金字塔用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。
金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似,层级越高,图像越小,分辨率越低。
cv.pyrUp(img) #对图像进行上采样
cv.pyrDown(img) #对图像进行下采样
总结:
图像缩放:
图像平移:
图像旋转:
仿射变换:
透射变换:
金字塔:
代码如下:
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
fengjing = cv.imread("./image/fengjing.jpg")
plt.imshow(fengjing[:, :, ::-1])
plt.show()
# 获取图像的绝对尺寸
rows, cols = fengjing.shape[:2]
print(rows)
print(cols)
'''对图像的大小进行调整,即图像的放大或缩小cv.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)src:输入图像dsize:绝对尺寸,直接指定调整后图像的大小fx,fy:相对尺寸,将dsize设置为None,然后将fx和fy设置为比例因子即可。interpolation:插值方法
'''
# 调整绝对尺寸,放大
res = cv.resize(fengjing, (2*rows, 2*cols))
plt.imshow(res[:, :, ::-1])
plt.show()
print(res.shape)
# 调整相对尺寸,缩小
res1 = cv.resize(fengjing, None, fx=0.5, fy=0.5)
plt.imshow(res1[:, :, ::-1])
# 翻转是因为用cv读图像默认是的通道是BGR,用plt输出要RGB。
plt.show()
print(res1.shape)
'''平移cv.warpAffine(img,M,dsize)img: 输入图像M:2*3移动矩阵 注意:将M设置为np.float32类型的Numpy数组。dsize:输出图像的大小 注意:输出图像的大小,应该是(宽度,高度)的形式,请记住,width=列数,height=行数。
'''
# 平移
M = np.float32([[1, 0, 100], [0, 1, 50]])
res3 = cv.warpAffine(fengjing, M, (cols, rows))
plt.imshow(res3[:, :, ::-1])
plt.show()
'''旋转在OpenCV中图像旋转首先根据旋转角度和旋转中心获取旋转矩阵,然后根据旋转矩阵进行变换,即可实现任意角度和任意中心的旋转效果。cv2.getRotationMatrix2D(center, angle, scale)center:旋转中心angle:旋转角度scale:缩放比例返回 M:旋转矩阵而后调用cv.warpAffine完成图像的旋转
'''
# 旋转
# 获取旋转矩阵
M = cv.getRotationMatrix2D((cols/2, rows/2), 45, 1)
# 旋转中心指定为图像的中间位置,旋转45度,缩放比例为1,即不进行缩放。
res5 = cv.warpAffine(fengjing, M, (cols, rows))
plt.imshow(res5[:, :, ::-1])
plt.show()
'''仿射变换图像的仿射变换涉及到图像的形状位置角度的变化,是深度学习预处理中常到的功能,仿射变换主要是对图像的缩放,旋转,翻转和平移等操作的组合。那什么是图像的仿射变换,如下图所示,图1中的点1, 2 和 3 与图二中三个点一一映射, 仍然形成三角形, 但形状已经大大改变,通过这样两组三点(感兴趣点)求出仿射变换, 接下来我们就能把仿射变换应用到图像中所有的点中,就完成了图像的仿射变换。
'''
# 仿射变换
# 原始图像的位置
pta1 = np.float32([[50, 50], [190, 50], [50, 190]])
# 仿射图像的位置
pta2 = np.float32([[100, 100], [190, 50], [100, 260]])
# 构建变换矩阵
M = cv.getAffineTransform(pta1, pta2)
print(M)
res7 = cv.warpAffine(fengjing, M, (cols, rows))
plt.imshow(res7[:, :, ::-1])
plt.show()
'''透射变换透射变换是视角变化的结果,是指利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。
'''
# 投射变换
pst1 = np.float32([[56, 65], [368, 53], [28, 387], [389, 390]])
pst2 = np.float32([[100, 150], [300, 100], [80, 290], [310, 300]])
T = cv.getPerspectiveTransform(pst1, pst2)
print(T)
res9 = cv.warpPerspective(fengjing, T, (cols, rows))
plt.imshow(res9[:, :, ::-1])
plt.show()
'''图像金字塔图像金字塔是图像多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。图像金字塔用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似,层级越高,图像越小,分辨率越低。cv.pyrUp(img) #对图像进行上采样cv.pyrDown(img) #对图像进行下采样
'''
# 图像金字塔
# 上采样
imgup = cv.pyrUp(fengjing)
plt.imshow(imgup[:, :, ::-1])
plt.show()
imgup1 = cv.pyrUp(imgup)
plt.imshow(imgup1[:, :, ::-1])
plt.show()
# 下采样
imgdown = cv.pyrDown(fengjing)
plt.imshow(imgdown[:, :, ::-1])
plt.show()
输出结果:
欢迎大家查看作者的主页,主页中还有关于编程与算法方面的更多内容,欢迎大家相互沟通学习~
上一篇:小程序开发必备功能的吐血整理【个人中心界面样式大全】
下一篇:三弟子格斗师