图像预处理-霍夫变换
最后更新时间:
文章总字数:
预计阅读时间:
一.概念
霍夫变换是图像处理的一种技术,主要用于检测图像中的直线、圆等几何形状。基本思想就是将图像空间(直角坐标系或极坐标系)中的点映射到(霍夫空间)参数空间中,通过在参数空间中寻找累计最大值实现对特定形状的检测。
接下来以下面这张图进行说明:
二.霍夫直线变换
这种简单的又称为标准霍夫变换。
2.1 直角坐标系
对于一条直线(不垂直于x轴的直线),都可以用 y=k x+b
来表示,此时,x和y是横纵坐标,k和b是一个固定参数。而霍夫变换将斜率k作为自变量,截距b作为因变量,式子也就变成了b = -xk+y
也就是说,霍夫空间中一点相当直角坐标系中的一条直线,霍夫空间中一条边相当于直角坐标系一个点。反之,霍夫空间的点和直线也可以映射到直角坐标系中。
同时我们是想要找到直角坐标系上的一条直线,因此我们引进了投票机制,让我们画的直线上包含更多的边缘点。而换到霍夫空间中,就是找到一个点,这个点被很多条直线经过。
2.2 极坐标系
然而直角坐标系中对于x=1这种直线(垂直于x轴)来说,y已经不存在了,斜率无穷大,无法映射到霍夫空间中去。因此我们需要采用另一种坐标系:
极坐标系
注意:极坐标系中的theta是不是该直线与x轴的角度,而是从原点作一条直线垂直于目标直线,垂直的直线与x轴的角度才对
极坐标系下是一样的,极坐标中的点对应霍夫空间中的线,霍夫空间中的点对应极坐标中的直线。并且此时的霍夫空间不再是以k为横轴、b为纵轴,而是以为θ横轴、ρ(上图中的r)为纵轴。
2.3 API使用
lines=cv2.HoughLines(image, rho, theta, threshold)
image:输入图像,通常为二值图像,其中白点表示边缘点,黑点为背景。
rho:r的精度,以像素为单位,表示霍夫空间中每一步的距离增量, 值越大,考虑越多的线。
theta:角度θ的精度,通常以弧度为单位,表示霍夫空间中每一步的角度增量。值越小,考虑越多的线。
threshold:累加数阈值,只有累积投票数(点数)超过这个阈值的候选直线才会被返回。
返回值:一个二维数组,每一行代表一条直线在霍夫空间中的参数 (rho, theta)也就是(r,θ)。
1 |
|
结果:
1 |
|
可见lines是三维数组,遍历时只能拿出一个数据,需要用line[0]
来取出二维数组中的每一个值。
1 |
|
上面说的公式就是这个推导而来:
也可以有另一个假设,y1,y2 = 0,img.shape[0]
,画出来的图都是一样的,opencv绘制直线是根据给出的坐标计算修改该线上其他点,超出的部分不绘制即可。就算起始坐标与终点坐标不在原图上也可以。
最后的阈值要合适,取的小容易得到很多错误的线,甚至可能检测到水平或垂直的线导致绘图时将坐标转为int类型时无法进行,因为角度趋近于0导致sin_theta
过小,进而使得int前坐标过大,报
1 |
|
1 |
|
结果:
三.统计概率霍夫直线变换
是一种改进的霍夫变换,它在获取到直线之后,会检测原图中在该直线上的点,并获取到两侧的端点坐标,也就是不需要我们自己计算坐标了。然后通过两个点的坐标来计算该直线的长度,通过直线长度与最短长度阈值的比较来决定该直线要不要被保留。
1 |
|
- image:输入图像,通常为二值图像,其中白点表示边缘点,黑点为背景。
- rho:极径分辨率,以像素为单位,表示极坐标系中的距离分辨率。
- theta:极角分辨率,以弧度为单位,表示极坐标系中角度的分辨率。
- threshold:阈值,用于过滤掉弱检测结果,只有累计投票数超过这个阈值的直线才会被返回。
- lines(可选):一个可初始化的输出数组,用于存储检测到的直线参数。
- minLineLength(可选):最短长度阈值,比这个长度短的线会被排除。
- maxLineGap(可选):同一直线两点之间的最大距离。当霍夫变换检测到一系列接近直角的线段时,这些线段可能是同一直线的不同部分。该参数指定了在考虑这些线段属于同一直线时,它们之间最大可接受的像素间隔。
返回值:一个二维数组,每个元素是一个包含4个元素的数组,分别表示每条直线的起始点和结束点在图像中的坐标(x1, y1, x2, y2)。
1 |
|
结果:
1 |
|
1 |
|
1 |
|
结果:
四.霍夫圆变换
它可以从图像中找出潜在的圆形结构,并返回它们的中心坐标和半径。只不过线是用(r,θ)表示,圆是用(x_center,y_center,r)来表示,从二维变成了三维,数据量变大了很多。所以一般使用霍夫梯度法减少计算量。
1 |
|
method:霍夫变换方法:霍夫梯度法,可以是 cv2.HOUGH_GRADIENT,这是唯一在OpenCV中用于圆检测的方法。
dp:累加器分辨率与输入图像分辨率之间的降采样比率,用于加速运算但不影响准确性。设置为1表示霍夫梯度法中累加器图像的分辨率与原图一致
minDist:检测到的圆心之间的最小允许距离,以像素为单位。
param1 和 param2:这两个参数是在使用 cv2.HOUGH_GRADIENT 方法时的特定参数,分别为:
param1(可选):阈值1,决定边缘强度的阈值。
param2:阈值2,控制圆心识别的精确度。较大的该值会使得检测更严格的圆。
返回值:一个二维numpy数组,包含了所有满足条件的圆的参数(x_center,y_center,r)。
1 |
|
结果:
1 |
|
1 |
|
这里使用的是np.int_向下取整对数组进行操作
1 |
|
结果: