itti文章的笔记

结合此处的代码，重新归纳整理一下算法的流程：

输入一幅分辨率的 $640\times 480$ 的RGB图像，记为 $I_0$ ；

对 $I_0$ 高斯平滑，然后再进行 $s = 2$ 降采样。即将图像尺寸行和列方向缩减一半（代码中是用 cv::pyrDown 函数一次处理），得到 $I_1$ （注：OpenCV实现了用于创建图像金字塔的两个函数 pyrDown 和 pryUp）；

重复第2步，得到 $I_2, I_3, I_4, I_5, I_6, I_7, I_8$ ， $I_8$ 的长宽分别为 $I_0$ 的 $1 / 256$ （注意 640 和480 都不能被 256 整除，个人觉得输入分辨率应该调整为256的倍数，不过这是小问题） ；

$I_0\sim I_8$ 分别有 $r$ 、 $g$ 、 $b$ 分量，计算每一个 $I_k$ 的“扩展颜色” $R$ 、 $G$ 、 $B$ 、 $Y$ 分量： $\begin{aligned} R_k &= r_k-\frac{g_k + b_k}{2}\\ G_k &= g_k-\frac{r_k + b_k}{2} \\ B_k&=b_k-\frac{r_k + g_k}{2} \\ Y_k&=\frac{(r_k + g_k)-| r_k-g_k |}{2}-b_k \end{aligned}$ 注意这里计算 $r$ 、 $g$ 、 $b$ 分量的时候增加了一步：对于每个分量查找最大值，然后每个分量里面那些小于最大值1/10的点都置零。
亮度图 $I’_k=\frac{r_k+g_k+b_k}{3}$ 亮度图计算时用的 $r$ 、 $g$ 、 $b$ 分量不作处理，直接用。
方向图 $O_k(\theta)=conv2d\left(I’_k,W_G(\sigma,\theta)\right)$ $W_G$ 表示 Gabor 滤波器，用于边缘提取的线性滤波器，其频率和方向表达与人类视觉系统类似，能够提供良好的方向选择和尺度选择特性，而且对于光照变化不敏感，因此十分适合纹理分析。参考代码用 cv::getGaborKernel((8, 8), 4, $\theta$ , 8, 1) 来求得，忽略掉了不同的尺度 $\sigma$ （注意这个 $\sigma$ 是论文中用来表示尺度的符号，不是 Gabor核函数中的 $\sigma$ 。Gabor核函数的详细说明看这里），我感觉这样不行。毕竟对于一幅尺寸为 $1024 \times 1024$ 的输入图像， $I_8$ 的尺寸才 $4\times 4$ 。 $\theta$ 这里用弧度表示， $[0\degree,45\degree,90\degree,135\degree]$ 分别对应 $[0,\; \pi/4,\;\pi/2,\;3\pi/4]$ 。 $c o n v 2 d$ 操作用 cv::filter2D 函数实现。

计算差分特征图：对以上几步形成的 $8\times 9=72$ 张图进行差分计算，最终得到42张特征图。论文选 $c=\{2,3,4\}$ ，代码中似乎取 $c=\{1,2,3\}$ ，以论文为准吧。
$s=c+\{3,4\}$ 则尺度 $s$ 的图像的长宽分别是尺度 $c$ 的图像的 1/8或者1/16分之一，先用 cv::resize 函数（interpolation=cv::INTER_NEAREST ）对尺度 $s$ 的图像进行放大，得到和尺度 $c$ 一样大小的图像，然后逐点减操作。得到 $\mathcal{I}(c,s)$ 、 $\mathcal{RG}(c,s)$ 、 $\mathcal{BY}(c,s)$ 以及 $\mathcal{O}(c,s,0\degree)$ 、 $\mathcal{O}(c,s,45\degree)$ 、 $\mathcal{O}(c,s,90\degree)$ 、 $\mathcal{O}(c,s,135\degree)$ 。参考公式1、公式2、公式3、公式4。每一组 $(c, s)$ 计算7张图，一共42张图。

42张特征图合并成一张。在什么尺度上合并呢，在 $\sigma=4$ 的尺度上合并，之前计算的42张特征图尺度分别是 ${2,3,4\}$ ，有24张特征图的长宽需要缩小到原来的1/4，有14张特征图需要缩小到原来的1/2。比如最开始输入的图像是 $640\times 480$ ，则合并的特征图分辨率是 $40\times 30$ 。

特征图的合并分两步进行，首先是组内合并，就是亮度特征和亮度特征合并（公式5），颜色特征和颜色特征合并（公式6(#eq7)），角度特征和角度特征合并（[公式7]）；第二步是这三个角度上的特征合并，求平均（公式8）。不管哪一步，合并之前都要。需要归一化操作。分两步进行归一化。

特征图 $A$ 求 $\mathcal{N}(A)$ ：1) 先找 $max(a_{i,j})$ ；2) 再找除了 $a_{i,j}$ 之外的局部最大值的平均 $\bar m$ ；3) $\lambda=(\max(a_{i,j})-\bar m)$ ，特征图里面所有的值都乘以 $\lambda$ 。参考代码求局部最大值的方法有点粗糙，没考虑“左上”、“右下”、“左下”、“右上”这4个点。

原文链接：https://blog.csdn.net/weixin_41665225/article/details/115422667

标签云

近期文章

分类

itti文章的笔记

相关文章