图像预处理-翻转与仿射变换

文章发布时间:

2025-06-24

最后更新时间:

2025-06-30

文章总字数:

1.2k

预计阅读时间:

4 分钟

一.图像翻转

cv2.flip(img,flipcode)

参数

flipcode : 指定翻转类型的标志，为0，表示沿x轴翻转，>0(默认1) 表示沿y轴翻转，为 <0(默认-1) 表示水平+垂直翻转

OpenCV中，图片的镜像旋转以图像的中心为原点。

import cv2 as cv
 
# 请在脑海里下意识记住这个操作
img = cv.imread('../images/cat1.png')
 
# 按镜像翻转
a = cv.flip(img, flipCode = -5)
cv.imshow('img', a)
cv.waitKey(0)
cv.destroyAllWindows()

结果：

二.图像仿射变换

仿射变换（Affine Transformation）是一种线性变换,保持了点之间的相对距离不变。

2.1 仿射变换的基本性质

保持直线
保持平行
比例不变性
不保持角度和长度

2.2 仿射变换的基本原理

线性变换
二维空间中，图像点坐标为(x,y)，仿射变换的目标是将这些点映射到新的位置(x’, y’)

下面用一个表达式来帮助理解：

中间的2*3矩阵就是变换矩阵，其中abcd都是处理旋转、平移、缩放的系数，tx，ty是平移的系数。

1
2
3

x' = x * a + y * b + tx

y' = x * c + y * d + ty

2.3 cv2.warpAffine(img,M,dsize)

M ：2x3的变换矩阵，类型为 np.float32
dsize：输出图像的尺寸，形式为 (width,height)。

上述的旋转、平移等操作都需要这个函数实现，通过传入各种操作的变换矩阵，实现各种操作。

三.仿射变换操作

3.1 图像旋转

cv2.getRotationMatrix2D(center,angle,scale)

获取旋转矩阵，参数为：

center：旋转中心点的坐标，格式为(x,y)。
angle：旋转角度，单位为度，正值表示逆时针旋转负值表示顺时针旋转。
scale：缩放比例，若设为1，则不缩放。

返回值是 M ，2x3的旋转矩阵。

import cv2 as cv
 
img = cv.imread('../images/cat1.png')
 
# 获取旋转的变换矩阵
re = cv.getRotationMatrix2D((img.shape[1]/2, img.shape[0]/2),45,1)
 
# 利用warpAffine进行旋转
img1 = cv.warpAffine(img, re, (img.shape[1], img.shape[0]))
 
cv.imshow('img', img)
cv.imshow('img1', img1)
cv.waitKey(0)
cv.destroyAllWindows()

结果：

3.2 图像平移

使用 np.float32() 创建数组，把这个二维数组(变化矩阵)作为参数传给 cv2.warpAffine() 函数就可以实现平移。

代入表达式可得

1
2
3

x' = x + tx

y' = y + ty

import cv2 as cv
import numpy as np
 
img = cv.imread('../images/cat1.png')
 
# 定义偏移量
tx = 100
ty = 50
 
# 定义平移变换矩阵
n = np.float32([[1,0,tx],[0,1,ty]])
 
 
# 使用warpAffine函数实现平移变换
img_shift = cv.warpAffine(img,n,(img.shape[1],img.shape[0]))
 
cv.imshow('img_shift',img_shift)
cv.waitKey(0)
cv.destroyAllWindows()

结果：

3.3 图像缩放

同理创建数组，下面是这个变换矩阵的理解：

代入表达式可得:

1
2
3

x' = x * sx

y' = y * sy

import cv2 as cv
import numpy as np
 
img = cv.imread('../images/cat1.png')
 
# 定义缩放比例
sx = 0.5
sy = 0.5
 
# 定义缩放变换矩阵
n = np.float32([[sx,0,0],[0,sy,0]])
 
# 这里最后的输出大小适配缩放后的尺寸
img_scale = cv.warpAffine(img,n,(int(img.shape[1]*sx),int(img.shape[0]*sy)))
 
cv.imshow('img_scale',img_scale)
cv.waitKey()
cv.destroyAllWindows()

结果：

3.4 图像剪切

剪切操作可以改变图形的形状，以便其在某个方向上倾斜，它将对象的形状改变为斜边平行四边形，而不改变其面积。也就是一个矩形的宽高都是不变的。它把图片的一个部分切下来放在了另一个地方。

那怎么实现呢？

沿x轴剪切：

1
2
3

x'=x+shy*y     

y'=y

沿y轴剪切：

1
2
3

y'=shx*x+y

x'=x

因为根据warpAffine函数的公式，想要在把图像的一块空间切下来放在另一个地方，不能操作tx，ty，这样会使得整个图像的每个像素点发生平移，不会改变图像具体形状构造，这就是其与平移的区别。然后公式中，能让x，y增减值的只有用 shy 和 shx ，让点的另一个轴坐标乘以剪切因子来实现偏移。

x' = x+shy*y

相当于给x方向上加y方向上的变化，这样就可以有一个矢量变化，方向就会变为斜向上或斜向下，从而实现拉扯。也就是所谓的x偏移，y不变；x不变，y偏移。

import cv2 as cv
import numpy as np
 
img = cv.imread('../images/cat1.png')
 
# 定义剪切因子（示例切y轴方向）
shx = 0.5
shy = 0
 
 
# 定义剪切变换矩阵
n = np.float32([[1,shy,0],[shx,1,0]])
 
img_warp = cv.warpAffine(img,n,(img.shape[1],img.shape[0]))
 
cv.imshow('img_warp',img_warp)
cv.waitKey(0)
cv.destroyAllWindows()

结果：

≡