技术领域
本发明涉及一种图像质量评价方法,尤其是涉及一种基于区域重要性分类的立体图像质量客观评价方法。
背景技术
随着图像编码技术和立体显示技术的迅速发展,立体图像技术受到了越来越广泛的关注与应用,已成为当前的一个研究热点。立体图像技术利用人眼的双目视差原理,双目各自独立地接收来自同一场景的左右视点图像,通过大脑融合形成双目视差,从而欣赏到具有深度感和逼真感的立体图像。由于会受到采集系统、存储压缩及传输设备的影响,立体图像会不可避免地引入一系列的失真,而与单通道图像相比,立体图像需要同时保证两个通道的图像质量,因此对其进行质量评价具有非常重要的意义。然而,目前对立体图像质量进行评价缺乏有效的客观评价方法。因此,研究有效的立体图像质量客观评价方法具有十分重要的意义。
目前的立体图像质量客观评价方法是直接将平面图像质量评价方法应用于评价立体图像质量,然而,人眼感知立体图像产生立体视觉的过程并不是简单的左右视点图像叠加的过程:1)立体视觉特征(例如,三维视觉注意力)并不是平面视觉特性的简单拓展;2)人类视觉对不同区域有不同的感知偏好(各区域对感知的重要性不一致)。因此,如何在立体图像质量评价过程中有效地根据区域重要性对评价结果进行融合,使得客观评价结果更加感觉符合人类视觉系统,都是在对立体图像进行客观质量评价过程中需要研究解决的问题。
发明内容
本发明所要解决的技术问题是提供一种基于区域重要性分类的立体图像质量客观评价方法,其能够有效地提高客观评价结果与主观感知的相关性。
本发明解决上述技术问题所采用的技术方案为:一种基于区域重要性分类的立体图像质量客观评价方法,其特征在于包括以下步骤:
①令Sorg表示原始的无失真的立体图像,令Sdis表示待评价的失真的立体图像,将Sorg的左视点图像记为{Lorg(x,y)},将Sorg的右视点图像记为{Rorg(x,y)},将Sdis的左视点图像记为{Ldis(x,y)},将Sdis的右视点图像记为{Rdis(x,y)},然后计算{Lorg(x,y)}与{Rorg(x,y)}之间的视差图像,记为其中,此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,Lorg(x,y)表示{Lorg(x,y)}中坐标位置为(x,y)的像素点的像素值,Rorg(x,y)表示{Rorg(x,y)}中坐标位置为(x,y)的像素点的像素值,Ldis(x,y)表示{Ldis(x,y)}中坐标位置为(x,y)的像素点的像素值,Rdis(x,y)表示{Rdis(x,y)}中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值;
②根据{Lorg(x,y)}、{Rorg(x,y)}、{Ldis(x,y)}、{Rdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,对应获取{Lorg(x,y)}、{Rorg(x,y)}、{Ldis(x,y)}、{Rdis(x,y)}中的每个像素点的振幅,然后根据{Lorg(x,y)}和{Rorg(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sorg的独眼图,记为{CMorg(x,y)},并根据{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算Sdis的独眼图,记为{CMdis(x,y)},其中,CMorg(x,y)表示{CMorg(x,y)}中坐标位置为(x,y)的像素点的像素值,CMdis(x,y)表示{CMdis(x,y)}中坐标位置为(x,y)的像素点的像素值;
③根据{CMorg(x,y)}、{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},其中,Dappear(x,y)表示{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值;
④根据{CMorg(x,y)}离散傅立叶变换后得到的振幅和相位,获取{CMorg(x,y)}的二维显著图;然后通过获取的视差梯度图和相对视差图,获取
的深度显著图;再根据{CMorg(x,y)}的二维显著图和
的深度显著图,获取{CMorg(x,y)}的三维显著图,记为{S3D(x,y)},其中,S3D(x,y)表示{S3D(x,y)}中坐标位置为(x,y)的像素点的像素值;
⑤根据{Dappear(x,y)}和{S3D(x,y)},将{CMdis(x,y)}分成四类区域,分别为显著失真区域显著非失真区域
非显著失真区域
非显著非失真区域
⑥根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,并根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点的相位;再根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q。
所述的步骤②的具体过程为:
②-1、采用log-Gabor滤波器对{Lorg(x,y)}进行滤波处理,得到{Lorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{Lorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{Lorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
②-2、根据{Lorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{Lorg(x,y)}中的每个像素点的振幅,将{Lorg(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-3、按照步骤②-1至步骤②-2获取{Lorg(x,y)}中的每个像素点的振幅的操作过程,以相同的方式获取{Rorg(x,y)}、{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅,将{Rorg(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{Ldis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{Rdis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-4、根据{Lorg(x,y)}和{Rorg(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sorg的独眼图,记为{CMorg(x,y)},将{CMorg(x,y)}中坐标位置为(x,y)的像素点的像素值记为CMorg(x,y),
表示{Rorg(x,y)}中坐标位置为
的像素点的振幅,
表示{Rorg(x,y)}中坐标位置为
的像素点的像素值;
②-5、根据{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sdis的独眼图,记为{CMdis(x,y)},将{CMdis(x,y)}中坐标位置为(x,y)的像素点的像素值记为CMdis(x,y),
表示{Rdis(x,y)}中坐标位置为
的像素点的振幅,
表示{Rdis(x,y)}中坐标位置为
的像素点的像素值。
所述的步骤③的具体过程为:
③-1、采用log-Gabor滤波器对{CMorg(x,y)}进行滤波处理,得到{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
③-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-3、按照步骤③-1至步骤③-2获取{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-4、计算{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅的标准差、偏度和峰度分别对应记为
和
N(x,y)表示以坐标位置为(x,y)的像素点为中心的邻域窗口,M表示N(x,y)内包含的像素点的个数,
表示{CMorg(x,y)}中坐标位置为(x1,y1)的像素点在不同尺度和方向的振幅,1≤x1≤W,1≤y1≤H;
计算{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅的标准差、偏度和峰度分别对应记为
和
表示{CMdis(x,y)}中坐标位置为(x1,y1)的像素点在不同尺度和方向的振幅;
③-5、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度及{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},将{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值记为Dappear(x,y),
所述的步骤③-4中邻域窗口N(x,y)的大小为4×4;所述的步骤③-5中当θ=1时取ωθ=0.5,当θ=2时取ωθ=0.75,当θ=3时取ωθ=1.5,当θ=4时取ωθ=6;所述的步骤③-5中取ρ=0.6、λ=0.05、γ=0.02。
所述的步骤④的具体过程为:
④-1、对{CMorg(x,y)}进行离散傅立叶变换,得到{CMorg(x,y)}的振幅和相位,分别对应记为{Morg(u,v)}和{Aorg(u,v)},其中,u表示变换域的振幅或相位的水平坐标位置,v表示变换域的振幅或相位的垂直坐标位置,1≤u≤W,1≤v≤H,Morg(u,v)表示{Morg(u,v)}中坐标位置为(u,v)的像素点的振幅值,Aorg(u,v)表示{Aorg(u,v)}中坐标位置为(u,v)的像素点的相位值;
④-2、计算{Morg(u,v)}的高频分量的振幅,记为{Forg(u,v)},将{Forg(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为Forg(u,v),Forg(u,v)=ln(Morg(u,v))-hm(u,v)*ln(Morg(u,v)),其中,ln()为以e为底的对数函数,e=2.718281828,符号“*”为卷积操作符号,hm(u,v)表示m×m的均值滤波矩阵,
④-3、根据{Forg(u,v)}和{Aorg(u,v)}进行离散傅立叶反变换,将获得的反变换图像作为{CMorg(x,y)}的二维显著图,记为{SMorg(x,y)},其中,SMorg(x,y)表示{SMorg(x,y)}中坐标位置为(x,y)的像素点的像素值;
④-4、采用高斯差分滤波器对进行滤波处理,得到
的视差梯度图,记为{D1(x,y)},将{D1(x,y)}中坐标位置为(x,y)的像素点的像素值记为D1(x,y),
④-5、根据中的最大视差值和最小视差值,计算
的相对视差图,记为{D2(x,y)},将{D2(x,y)}中坐标位置为(x,y)的像素点的像素值记为D2(x,y),
其中,dmin表示
中的最小视差值,dmax表示
中的最大视差值;
④-6、根据的视差梯度图{D1(x,y)}和相对视差图{D2(x,y)},获取
的深度显著图,记为{D(x,y)},将{D(x,y)}中坐标位置为(x,y)的像素点的像素值记为D(x,y),
其中,
表示D1(x,y)的权重,
表示D2(x,y)的权重,
④-7、根据{CMorg(x,y)}的二维显著图{SMorg(x,y)}和的深度显著图{D(x,y)},获取{CMorg(x,y)}的三维显著图,记为{S3D(x,y)},将{S3D(x,y)}中坐标位置为(x,y)的像素点的像素值记为S3D(x,y),
其中,
表示SMorg(x,y)的权重,
表示D(x,y)的权重,
所述的步骤④-2中取m=3;所述的步骤④-4中取σ1=0.67,k1=4;所述的步骤④-6中取所述的步骤④-7中取
所述的步骤⑤的具体过程为:
⑤-1、将{CMdis(x,y)}中当前待处理的像素点定义为当前像素点;
⑤-2、假设当前像素点的坐标位置为(x1,y1),其中,1≤x1≤W,1≤y1≤H;
⑤-3、如果S3D(x1,y1)>T1且Dappear(x1,y1)>T2,则将当前像素点归属为显著失真区域如果S3D(x1,y1)>T1且Dappear(x1,y1)≤T2,则将当前像素点归属为显著非失真区域
如果S3D(x1,y1)≤T1且Dappear(x1,y1)>T2,则将当前像素点归属为非显著失真区域
如果S3D(x1,y1)≤T1且Dappear(x1,y1)≤T2,则将当前像素点归属为非显著非失真区域
其中,T1为{S3D(x,y)}通过大津法得到的自适应阈值,T2=k2σ2,σ2为{Dappear(x,y)}的标准差,k2为控制参数,S3D(x1,y1)表示{S3D(x,y)}中坐标位置为(x1,y1)的像素点的像素值,Dappear(x1,y1)表示{Dappear(x,y)}中坐标位置为(x1,y1)的像素点的像素值;
⑤-4、将{CMdis(x,y)}中下一个待处理的像素点作为当前像素点,然后返回步骤⑤-2继续执行,直至{CMdis(x,y)}中的所有像素点处理完毕。
所述的步骤⑤-3中取k2=1.54。
所述的步骤⑥的具体过程为:
⑥-1、采用log-Gabor滤波器对{CMorg(x,y)}进行滤波处理,得到{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
⑥-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,将{CMorg(x,y)}中坐标位置为(x,y)的像素点的相位记为LPorg(x,y),
⑥-3、按照步骤⑥-1至步骤⑥-2获取{CMorg(x,y)}中的每个像素点的相位的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点的相位,将{CMdis(x,y)}中坐标位置为(x,y)的像素点的相位记为LPdis(x,y);
⑥-4、根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q,Q=w1×Q1+w2×Q2+w3×Q3+w4×Q4,其中,w1表示Q1的权重,w2表示Q2的权重,w3表示Q3的权重,w4表示Q4的权重,w1+w2+w3+w4=1,C1为控制参数。
所述的步骤⑥-4中取w1=0.475,w2=0.280,w3=0.045,w4=0.200,C1=0.000001。
与现有技术相比,本发明的优点在于:
1)本发明方法分别提取出无失真的立体图像的独眼图与待评价的失真的立体图像的独眼图之间的结构失真图、待评价的失真的立体图像的独眼图的三维显著图,得到的结构失真图和三维显著图能够较好地反映人眼对不同区域的敏感程度,使得客观评价结果能更符合人类视觉,从而有效地提高了客观评价结果与主观感知的相关性。
2)本发明方法将待评价的失真的立体图像的独眼图分成显著失真、显著非失真、非显著失真和非显著非失真这四个区域分别进行评价,并对各个区域的客观评价度量值进行融合得到待评价的失真的立体图像的图像质量客观评价预测值,有效地提高了客观评价结果与主观感知的相关性。
附图说明
图1为本发明方法的总体实现框图;
图2a为Akko&Kayo立体图像的独眼图的二维显著图;
图2b为Akko&Kayo立体图像的左视点图像与右视点图像之间的视差图像的深度显著图;
图2c为Akko&Kayo立体图像的独眼图的三维显著图;
图3a为Door Flowers立体图像的独眼图的二维显著图;
图3b为Door Flowers立体图像的左视点图像与右视点图像之间的视差图像的深度显著图;
图3c为Door Flowers立体图像的独眼图的三维显著图;
图4a为Leaving Laptop立体图像的独眼图的二维显著图;
图4b为Leaving Laptop立体图像的左视点图像与右视点图像之间的视差图像的深度显著图;
图4c为Leaving Laptop立体图像的独眼图的三维显著图;
图5a为Akko&Kayo(640×480)立体图像的左视点图像;
图5b为Alt Moabit(1024×768)立体图像的左视点图像;
图5c为Balloons(1024×768)立体图像的左视点图像;
图5d为Door Flowers(1024×768)立体图像的左视点图像;
图5e为Kendo(1024×768)立体图像的左视点图像;
图5f为Leaving Laptop(1024×768)立体图像的左视点图像;
图5g为Lovebird1(1024×768)立体图像的左视点图像;
图5h为Newspaper(1024×768)立体图像的左视点图像;
图5i为Xmas(640×480)立体图像的左视点图像;
图6为失真立体图像集合中的各幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值的散点图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种基于区域重要性分类的立体图像质量客观评价方法,其总体实现框图如图1所示,其首先分别计算原始的无失真的立体图像的独眼图和待评价的失真的立体图像的独眼图,然后计算两个独眼图之间的结构失真图和原始的无失真的立体图像的独眼图的三维显著图,再将待评价的失真的立体图像的独眼图分成显著失真、显著非失真、非显著失真和非显著非失真这四个区域分别进行评价,并对各个区域的客观评价度量值进行融合,得到待评价的失真的立体图像的图像质量客观评价预测值,具体包括以下步骤:
①令Sorg表示原始的无失真的立体图像,令Sdis表示待评价的失真的立体图像,将Sorg的左视点图像记为{Lorg(x,y)},将Sorg的右视点图像记为{Rorg(x,y)},将Sdis的左视点图像记为{Ldis(x,y)},将Sdis的右视点图像记为{Rdis(x,y)},然后采用立体匹配法计算{Lorg(x,y)}与{Rorg(x,y)}之间的视差图像,记为其中,此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,Lorg(x,y)表示{Lorg(x,y)}中坐标位置为(x,y)的像素点的像素值,Rorg(x,y)表示{Rorg(x,y)}中坐标位置为(x,y)的像素点的像素值,Ldis(x,y)表示{Ldis(x,y)}中坐标位置为(x,y)的像素点的像素值,Rdis(x,y)表示{Rdis(x,y)}中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值。
②根据{Lorg(x,y)}、{Rorg(x,y)}、{Ldis(x,y)}、{Rdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,对应获取{Lorg(x,y)}、{Rorg(x,y)}、{Ldis(x,y)}、{Rdis(x,y)}中的每个像素点的振幅,然后根据{Lorg(x,y)}和{Rorg(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sorg的独眼图,记为{CMorg(x,y)},并根据{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算Sdis的独眼图,记为{CMdis(x,y)},其中,CMorg(x,y)表示{CMorg(x,y)}中坐标位置为(x,y)的像素点的像素值,CMdis(x,y)表示{CMdis(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤②的具体过程为:
②-1、采用log-Gabor滤波器对{Lorg(x,y)}进行滤波处理,得到{Lorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{Lorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{Lorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
②-2、根据{Lorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{Lorg(x,y)}中的每个像素点的振幅,将{Lorg(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-3、按照步骤②-1至步骤②-2获取{Lorg(x,y)}中的每个像素点的振幅的操作过程,以相同的方式获取{Rorg(x,y)}、{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅,将{Rorg(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{Ldis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{Rdis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
例如:获取{Ldis(x,y)}中的每个像素点的振幅的具体过程为:1)采用log-Gabor滤波器对{Ldis(x,y)}进行滤波处理,得到{Ldis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{Ldis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{Ldis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
根据{Ldis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{Ldis(x,y)}中的每个像素点的振幅,将{Ldis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-4、根据{Lorg(x,y)}和{Rorg(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sorg的独眼图,记为{CMorg(x,y)},将{CMorg(x,y)}中坐标位置为(x,y)的像素点的像素值记为CMorg(x,y),
表示{Rorg(x,y)}中坐标位置为
的像素点的振幅,
表示{Rorg(x,y)}中坐标位置为
的像素点的像素值。
②-5、根据{Ldis(x,y)}和{Rdis(x,y)}中的每个像素点的振幅及中的每个像素点的像素值,计算Sdis的独眼图,记为{CMdis(x,y)},将{CMdis(x,y)}中坐标位置为(x,y)的像素点的像素值记为CMdis(x,y),
表示{Rdis(x,y)}中坐标位置为
的像素点的振幅,
表示{Rdis(x,y)}中坐标位置为
的像素点的像素值。
③根据{CMorg(x,y)}、{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},其中,Dappear(x,y)表示{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤③的具体过程为:
③-1、采用log-Gabor滤波器对{CMorg(x,y)}进行滤波处理,得到{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
③-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-3、按照步骤③-1至步骤③-2获取{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为即获取{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程为:1)采用log-Gabor滤波器对{CMdis(x,y)}进行滤波处理,得到{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-4、计算{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅的标准差、偏度和峰度分别对应记为
和
表示{CMorg(x,y)}中坐标位置为(x1,y1)的像素点在不同尺度和方向的振幅,1≤x1≤W,1≤y1≤H。
计算{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅的标准差、偏度和峰度分别对应记为
和
表示{CMdis(x,y)}中坐标位置为(x1,y1)的像素点在不同尺度和方向的振幅。
③-5、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度及{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},将{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值记为Dappear(x,y),
④根据{CMorg(x,y)}离散傅立叶变换后得到的振幅和相位,获取{CMorg(x,y)}的二维显著图;然后通过获取的视差梯度图和相对视差图,获取
的深度显著图;再根据{CMorg(x,y)}的二维显著图和
的深度显著图,获取{CMorg(x,y)}的三维显著图,记为{S3D(x,y)},其中,S3D(x,y)表示{S3D(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤④的具体过程为:
④-1、对{CMorg(x,y)}进行离散傅立叶变换,得到{CMorg(x,y)}的振幅和相位,分别对应记为{Morg(u,v)}和{Aorg(u,v)},其中,u表示变换域的振幅或相位的水平坐标位置,v表示变换域的振幅或相位的垂直坐标位置,1≤u≤W,1≤v≤H,Morg(u,v)表示{Morg(u,v)}中坐标位置为(u,v)的像素点的振幅值,Aorg(u,v)表示{Aorg(u,v)}中坐标位置为(u,v)的像素点的相位值。
④-2、计算{Morg(u,v)}的高频分量的振幅,记为{Forg(u,v)},将{Forg(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为Forg(u,v),Forg(u,v)=ln(Morg(u,v))-hm(u,v)*ln(Morg(u,v)),其中,ln()为以e为底的对数函数,e=2.718281828,符号“*”为卷积操作符号,hm(u,v)表示m×m的均值滤波矩阵,在此取m×m的值为3×3,即
④-3、根据{Forg(u,v)}和{Aorg(u,v)}进行离散傅立叶反变换,将获得的反变换图像作为{CMorg(x,y)}的二维显著图,记为{SMorg(x,y)},其中,SMorg(x,y)表示{SMorg(x,y)}中坐标位置为(x,y)的像素点的像素值。
④-4、采用高斯差分滤波器对进行滤波处理,得到
的视差梯度图,记为{D1(x,y)},将{D1(x,y)}中坐标位置为(x,y)的像素点的像素值记为D1(x,y),
④-5、根据中的最大视差值和最小视差值,计算
的相对视差图,记为{D2(x,y)},将{D2(x,y)}中坐标位置为(x,y)的像素点的像素值记为D2(x,y),
其中,dmin表示
中的最小视差值,dmax表示
中的最大视差值。
④-6、根据的视差梯度图{D1(x,y)}和相对视差图{D2(x,y)},获取
的深度显著图,记为{D(x,y)},将{D(x,y)}中坐标位置为(x,y)的像素点的像素值记为D(x,y),
其中,
表示D1(x,y)的权重,
表示D2(x,y)的权重,
在此取
④-7、根据{CMorg(x,y)}的二维显著图{SMorg(x,y)}和的深度显著图{D(x,y)},获取{CMorg(x,y)}的三维显著图,记为{S3D(x,y)},将{S3D(x,y)}中坐标位置为(x,y)的像素点的像素值记为S3D(x,y),
其中,
表示SMorg(x,y)的权重,
表示D(x,y)的权重,
在此取
在此,图2a、图2b和图2c分别给出了“Akko&Kayo”的独眼图的二维显著图、“Akko&Kayo”的左视点图像与右视点图像之间的视差图像的深度显著图、“Akko&Kayo”的独眼图的三维显著图,图3a、图3b和图3c分别给出了“Door Flowers”的独眼图的二维显著图、“Door Flowers”的左视点图像与右视点图像之间的视差图像的深度显著图、“DoorFlowers”的独眼图的三维显著图,图4a、图4b和图4c分别给出了“Leaving Laptop”的独眼图的二维显著图、“Leaving Laptop”的左视点图像与右视点图像之间的视差图像的深度显著图、“Leaving Laptop”的独眼图的三维显著图,从图2c、图3c和图4c中可以看出,本发明方法提取的三维显著图能够很好地反映人类视觉注意力。
⑤根据{Dappear(x,y)}和{S3D(x,y)},将{CMdis(x,y)}分成四类区域,分别为显著失真区域显著非失真区域
非显著失真区域
非显著非失真区域
在此具体实施例中,步骤⑤的具体过程为:
⑤-1、将{CMdis(x,y)}中当前待处理的像素点定义为当前像素点。
⑤-2、假设当前像素点的坐标位置为(x1,y1),其中,1≤x1≤W,1≤y1≤H。
⑤-3、如果S3D(x1,y1)>T1且Dappear(x1,y1)>T2,则将当前像素点归属为显著失真区域如果S3D(x1,y1)>T1且Dappear(x1,y1)≤T2,则将当前像素点归属为显著非失真区域
如果S3D(x1,y1)≤T1且Dappear(x1,y1)>T2,则将当前像素点归属为非显著失真区域
如果S3D(x1,y1)≤T1且Dappear(x1,y1)≤T2,则将当前像素点归属为非显著非失真区域
其中,T1为{S3D(x,y)}通过大津法得到的自适应阈值,T2=k2σ2,σ2为{Dappear(x,y)}的标准差,k2为控制参数,在此取k2=1.54,S3D(x1,y1)表示{S3D(x,y)}中坐标位置为(x1,y1)的像素点的像素值,Dappear(x1,y1)表示{Dappear(x,y)}中坐标位置为(x1,y1)的像素点的像素值。
⑤-4、将{CMdis(x,y)}中下一个待处理的像素点作为当前像素点,然后返回步骤⑤-2继续执行,直至{CMdis(x,y)}中的所有像素点处理完毕。
⑥根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,并根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点的相位;再根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q。
在此具体实施例中,步骤⑥的具体过程为:
⑥-1、采用log-Gabor滤波器对{CMorg(x,y)}进行滤波处理,得到{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{CMorg(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
⑥-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,将{CMorg(x,y)}中坐标位置为(x,y)的像素点的相位记为LPorg(x,y),
⑥-3、按照步骤⑥-1至步骤⑥-2获取{CMorg(x,y)}中的每个像素点的相位的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点的相位,将{CMdis(x,y)}中坐标位置为(x,y)的像素点的相位记为LPdis(x,y)。即:获取{CMdis(x,y)}中的每个像素点的相位的操作过程为:1)采用log-Gabor滤波器对{CMdis(x,y)}进行滤波处理,得到{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
2)根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点的相位,将{CMdis(x,y)}中坐标位置为(x,y)的像素点的相位记为LPdis(x,y),
⑥-4、根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q,Q=w1×Q1+w2×Q2+w3×Q3+w4×Q4,其中,w1表示Q1的权重,w2表示Q2的权重,w3表示Q3的权重,w4表示Q4的权重,w1+w2+w3+w4=1,在此取w1=0.475,w2=0.280,w3=0.045,w4=0.200,C1为控制参数,在此取C1=0.000001。
⑦采用n幅原始的无失真的立体图像,建立其在不同失真类型不同失真程度下的失真立体图像集合,该失真立体图像集合包括多幅失真的立体图像,利用主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100],n≥1;然后按照步骤①至步骤⑥计算Sdis的图像质量客观评价预测值Q的操作,以相同的方式分别计算该失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。
在本实施例中,利用9幅无失真的立体图像(图5a、图5b、图5c、图5d、图5e、图5f、图5g、图5h和图5i分别给出了立体图像的左视点图像),建立对应在高斯模糊下5个失真等级、高斯白噪声下5个失真等级、JPEG压缩下5个失真等级、JPEG2000压缩下5个失真等级、H.264压缩下6个失真等级的一共234幅失真立体图像作为测试立体图像。这234幅失真立体图像构成一个失真立体图像集合,利用现有的主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100];然后按照步骤①至步骤⑥计算Sdis的图像质量客观评价预测值Q的操作,以相同的方式分别计算该失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。
采用图5a至图5i所示的9幅无失真的立体图像在不同程度的JPEG压缩、JPEG2000压缩、高斯模糊、白噪声和H.264编码失真情况下的234幅失真的立体图像来分析这234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值之间的相关性。在本实施例中,利用评估图像质量评价方法的4个常用客观参量作为评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient,PLCC)、Spearman相关系数(Spearman rank order correlation coefficient,SROCC)、Kendall相关系数(Kendall rank-order correlation coefficient,KROCC)、均方误差(root mean squared error,RMSE),PLCC和RMSE反映失真的立体图像的图像质量客观评价预测值的准确性,SROCC和KROCC反映其单调性。将计算得到的234幅失真的立体图像的图像质量客观评价预测值做四参数Logistic函数非线性拟合,PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明的质量客观评价方法与平均主观评分差值相关性越好。反映立体图像客观评价方法性能的PLCC、SROCC、KROCC和RMSE系数如表1所列,从表1所列的数据可知,按本发明方法得到的失真的立体图像的最终的图像质量客观评价预测值与平均主观评分差值之间的相关性是很高的,这充分表明了客观评价结果与人眼主观感知的结果较为一致,足以说明本发明方法的有效性。
将本发明方法与现有的全局评价方法的性能进行比较,全局评价方法直接从全局图像中得到图像质量评价预测值(不考虑不同区域的重要性),表2给出了本发明方法与全局评价方法的PLCC和SROCC性能的比较结果,从表2中可以看出,由于本发明方法根据区域重要性对各个区域分别进行评价,并对各个区域的客观评价度量值进行融合,得到的图像质量评价预测值与平均主观评分差值之间的相关性更强,足以说明本方法是有效的。
图6给出了234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值的散点图,散点越集中,说明客观评价结果与主观感知的一致性越好。从图6中可以看出,采用本发明方法得到的散点图比较集中,与主观评价数据之间的吻合度较高。
表1利用本发明方法得到的234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值之间的相关性
表2本发明方法与全局评价方法的PLCC和SROCC性能的比较结果