技术领域
本发明涉及一种图像质量评价方法,尤其是涉及一种基于机器学习的立体图像视觉舒适度评价方法。
背景技术
随着立体视频显示技术和高质量立体视频内容获取技术的快速发展,立体视频的视觉体验质量(QoE,quality of experience)是立体视频系统设计中的一个重要问题,而视觉舒适度(VC,visual comfort)是影响立体视频的QoE的重要因素。目前,对立体视频/图像的质量评价研究主要考虑内容失真对于图像质量的影响,而很少考虑视觉舒适度等因素的影响。因此,为了提高观看者的视觉体验质量,研究立体视频/图像的视觉舒适度客观评价模型对指导3D内容的制作和后期处理具有十分重要的作用。
传统的立体图像视觉舒适度评价方法主要采用全局的视差统计特性来预测视觉舒适度。然而,根据人眼立体视觉注意力特性,人眼只对部分视觉重要区域的视觉舒适/不舒适比较敏感,如果以此全局的视差统计特征来预测视觉重要区域的视觉舒适程度,会导致无法精确预测得到客观评价值。因此,如何在评价过程中有效地根据视觉重要区域来提取出视觉舒适度特征,使得客观评价结果更加感觉符合人类视觉系统,是在对立体图像进行客观视觉舒适度评价过程中需要研究解决的问题。
发明内容
本发明所要解决的技术问题是提供一种基于机器学习的立体图像视觉舒适度评价方法,其能够有效地提高客观评价结果与主观感知的相关性。
本发明解决上述技术问题所采用的技术方案为:一种基于机器学习的立体图像视觉舒适度评价方法,其特征在于包括以下步骤:
①将待评价的立体图像的左视点图像记为{IL(x,y)},将待评价的立体图像的右视点图像记为{IR(x,y)},将待评价的立体图像的右视差图像记为{dR(x,y)},其中,此处(x,y)表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}的宽度,H表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}的高度,IL(x,y)表示{IL(x,y)}中坐标位置为(x,y)的像素点的像素值,IR(x,y)表示{IR(x,y)}中坐标位置为(x,y)的像素点的像素值,dR(x,y)表示{dR(x,y)}中坐标位置为(x,y)的像素点的像素值;
②提取出{IR(x,y)}的显著图;然后根据{IR(x,y)}的显著图和{dR(x,y)},获取{IR(x,y)}的视觉显著图;再将{IR(x,y)}的视觉显著图划分为视觉重要区域和非视觉重要区域;最后根据{IR(x,y)}的视觉显著图的视觉重要区域和非视觉重要区域,获取待评价的立体图像的视觉重要区域掩膜,记为{M(x,y)},其中,M(x,y)表示{M(x,y)}中坐标位置为(x,y)的像素点的像素值;
③根据{dR(x,y)}和{M(x,y)},获取{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的视差均值μ、视差方差δ、最大负视差θ、视差范围χ,然后将μ、δ、θ和χ按顺序进行排列构成用于反映{dR(x,y)}的视差幅度特征的特征矢量,记为F1,F1=(μ,δ,θ,χ);
④通过计算{dR(x,y)}的视差梯度幅值图像和视差梯度方向图像,计算{dR(x,y)}的视差梯度边缘图像;然后根据{dR(x,y)}的视差梯度边缘图像和{M(x,y)},计算{dR(x,y)}的视差梯度边缘图像中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的梯度均值ψ;最后将ψ作为用于反映{dR(x,y)}的视差梯度特征的特征矢量,记为F2;
⑤获取{IR(x,y)}的空间频率图像;然后根据{IR(x,y)}的空间频率图像和{M(x,y)},获取{IR(x,y)}的空间频率图像中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率均值ν、空间频率方差ρ、空间频率范围ζ、空间频率敏感因子τ;再将ν、ρ、ζ和τ按顺序进行排列构成用于反映{IR(x,y)}的空间频率特征的特征矢量,记为F3,F3=(ν,ρ,ζ,τ);
⑥将F1、F2及F3构成一个新的特征矢量,记为X,X=[F1,F2,F3],然后将X作为待评价的立体图像的特征矢量,其中,符号“[]”为矢量表示符号,[F1,F2,F3]表示将F1、F2和F3连接起来形成一个新的特征矢量;
⑦采用n副不同的立体图像以及对应的右视差图像建立立体图像集合,利用主观质量评价方法分别计算立体图像集合中的每副立体图像的视觉舒适度的平均主观评分均值,记为MOS,其中,n≥1,MOS∈[1,5];然后按照步骤①至步骤⑥计算待评价的立体图像的特征矢量X的操作,以相同的方式分别计算立体图像集合中的每幅立体图像的特征矢量,将立体图像集合中的第i幅立体图像的特征矢量记为Xi,其中,1≤i≤n,n表示立体图像集合中包含的立体图像的幅数;
⑧将立体图像集合中的所有立体图像分成训练集和测试集,将训练集中的所有立体图像的特征矢量和平均主观评分均值构成训练样本数据集合,将测试集中的所有立体图像的特征矢量和平均主观评分均值构成测试样本数据集合,然后采用支持向量回归作为机器学习的方法,对训练样本数据集合中的所有立体图像的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小,拟合得到最优的权重矢量wopt和最优的偏置项bopt,接着利用wopt和bopt构造得到支持向量回归训练模型,再根据支持向量回归训练模型,对测试样本数据集合中的每幅立体图像的特征矢量进行测试,预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,将测试样本数据集合中的第k'幅立体图像的客观视觉舒适度评价预测值记为Qk',Qk'=f(Xk'),其中,f()为函数表示形式,Xk'表示测试样本数据集合中的第k'幅立体图像的特征矢量,(wopt)T为wopt的转置矩阵,
表示测试样本数据集合中的第k'幅立体图像的线性函数,1≤k'≤n-t,t表示训练集中包含的立体图像的幅数;之后通过重新分配训练集和测试集,重新预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,经过N次迭代后计算立体图像中的每幅立体图像的客观视觉舒适度评价预测值的平均值,并将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度预测值,其中,N的值取大于100。
所述的步骤②的具体过程为:
②-1、采用基于图论的视觉显著性模型提取出{IR(x,y)}的显著图,记为{SMR(x,y)},其中,SMR(x,y)表示{SMR(x,y)}中坐标位置为(x,y)的像素点的像素值;
②-2、根据{SMR(x,y)}和{dR(x,y)},获取{IR(x,y)}的视觉显著图,记为{DR(x,y)},将{DR(x,y)}中坐标位置为(x,y)的像素点的像素值记为DR(x,y),其中,
表示SMR(x,y)的权重,
表示dR(x,y)的权重,
②-3、根据{DR(x,y)}中的每个像素点的像素值,将{DR(x,y)}划分为视觉重要区域和非视觉重要区域,{DR(x,y)}的视觉重要区域中的每个像素点的像素值大于自适应阈值T1,{DR(x,y)}的非视觉重要区域中的每个像素点的像素值小于或等于自适应阈值T1,其中,T1为利用大津法对{DR(x,y)}进行处理得到的阈值;
②-4、根据{DR(x,y)}的视觉重要区域和非视觉重要区域,获取待评价的立体图像的视觉重要区域掩膜,记为{M(x,y)},将{M(x,y)}中坐标位置为(x,y)的像素点的像素值记为M(x,y),
所述的步骤②-2中取。
所述的步骤③的具体过程为:
③-1、根据{dR(x,y)}和{M(x,y)},计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的视差均值,记为μ,
③-2、根据{dR(x,y)}和{M(x,y)}及μ,计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的视差方差,记为δ,
③-3、计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的最大负视差,记为θ,其中,θ的值为{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最小的1%像素点的视差均值;
③-4、计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的视差范围,记为χ,χ=dmax-dmin,其中,dmax表示{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最大的1%像素点的视差均值,dmin表示{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最小的1%像素点的视差均值;
③-5、将μ、δ、θ和χ按顺序进行排列构成用于反映{dR(x,y)}的视差幅度特征的特征矢量,记为F1,F1=(μ,δ,θ,χ),F1的维数为4。
所述的步骤④的具体过程为:
④-1、计算{dR(x,y)}的视差梯度幅值图像,记为{m(x,y)},将{m(x,y)}中坐标位置为(x,y)的像素点的梯度幅值记为m(x,y),其中,Gx(x,y)表示{m(x,y)}中坐标位置为(x,y)的像素点的水平梯度值,Gy(x,y)表示{m(x,y)}中坐标位置为(x,y)的像素点的垂直梯度值;
④-2、计算{dR(x,y)}的视差梯度方向图像,记为{θ(x,y)},将{θ(x,y)}中坐标位置为(x,y)的像素点的梯度方向值记为θ(x,y),θ(x,y)=arctan(Gy(x,y)/Gx(x,y)),其中,arctan()为取反正切函数;
④-3、根据{m(x,y)}和{θ(x,y)},计算{dR(x,y)}的视差梯度边缘图像,记为{E(x,y)},将{E(x,y)}中坐标位置为p的像素点的梯度边缘值记为E(p),
其中,Gs(||p-q||)表示标准差为σs的高斯函数,
p-q表示坐标位置p和坐标位置q之间的欧氏距离,符号“|| ||”为求欧氏距离符号,
表示标准差为σo的高斯函数,
表示
与
之间的欧氏距离,
m(q)表示{m(x,y)}中坐标位置为q的像素点的梯度幅值,m(q')表示{m(x,y)}中坐标位置为q'的像素点的梯度幅值,εg为控制参数,符号“[]”为矢量表示符号,exp()表示以e为底的指数函数,e=2.71828183,
表示以坐标位置为p的像素点为中心的邻域窗口,
表示以坐标位置为q的像素点为中心的邻域窗口;
④-4、根据{E(x,y)}和{M(x,y)},计算{E(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的梯度均值,记为ψ,其中,Ω表示图像域范围,E(x,y)表示{E(x,y)}中坐标位置为(x,y)的像素点的梯度边缘值;
④-5、将ψ作为用于反映{dR(x,y)}的视差梯度特征的特征矢量,记为F2,F2的维数为1。
所述的步骤④-3中取σs=0.4,σo=0.4,εg=0.5。
所述的步骤④-3中的大小为3×3,
的大小为3×3。
所述的步骤⑤的具体过程为:
⑤-1、计算{IR(x,y)}的空间频率图像,记为{SF(x,y)},将{SF(x,y)}中坐标位置为(x,y)的像素点的空间频率值记为SF(x,y),
⑤-2、根据{SF(x,y)}和{M(x,y)},计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的空间频率均值,记为ν,
⑤-3、根据{SF(x,y)}和{M(x,y)}及ν,计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的空间频率方差,记为ρ,
⑤-4、计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率范围,记为ζ,ζ=SFmax-SFmin,其中,SFmax表示{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内空间频率值最大的1%像素点的空间频率均值,SFmin表示{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内空间频率值最小的1%像素点的空间频率均值;
⑤-5、计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率敏感因子,记为τ,τ=ν/μ;
⑤-6、将ν、ρ、ζ和τ按顺序进行排列构成用于反映{IR(x,y)}的空间频率特征的特征矢量,记为F3,F3=(ν,ρ,ζ,τ),F3的维数为4。
所述的步骤⑧的具体过程为:
⑧-1、随机选择立体图像集合中的幅立体图像构成训练集,将立体图像集合中剩余的n-t幅立体图像构成测试集,其中,符号
为向上取整符号;
⑧-2、将训练集中的所有立体图像的特征矢量和平均主观评分均值构成训练样本数据集合,记为Ωt,{Xk,MOSk}∈Ωt,其中,Xk表示训练样本数据集合Ωt中的第k幅立体图像的特征矢量,MOSk表示训练样本数据集合Ωt中的第k幅立体图像的平均主观评分均值,1≤k≤t;
⑧-3、构造训练样本数据集合Ωt中的每幅立体图像的特征矢量的回归函数,将Xk的回归函数记为f(Xk),其中,f()为函数表示形式,w为权重矢量,wT为w的转置矩阵,b为偏置项,
表示Xk的线性函数,
D(Xk,Xl)为支持向量回归中的核函数,
Xl为训练样本数据集合Ωt中的第l幅立体图像的特征矢量,1≤l≤t,γ为核参数,exp()表示以e为底的指数函数,e=2.71828183,符号“|| ||”为求欧式距离符号;
⑧-4、采用支持向量回归对训练样本数据集合Ωt中的所有立体图像的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小,拟合得到最优的权重矢量wopt和最优的偏置项bopt,将最优的权重矢量wopt和最优的偏置项bopt的组合记为(wopt,bopt),其中,Ψ表示对训练样本数据集合Ωt中的所有立体图像的特征矢量进行训练的所有的权重矢量和偏置项的组合的集合,
表示支持向量回归训练模型的输入矢量Xinp的线性函数;
⑧-5、将测试集中的所有立体图像的特征矢量和平均主观评分均值构成测试样本数据集合,然后根据支持向量回归训练模型,对测试样本数据集合中的每幅立体图像的特征矢量进行测试,预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,将测试样本数据集合中的第k'幅立体图像的客观视觉舒适度评价预测值记为Qk',Qk'=f(Xk'),其中,Xk'表示测试样本数据集合中的第k'幅立体图像的特征矢量,
表示测试样本数据集合中的第k'幅立体图像的线性函数,1≤k'≤n-t;
⑧-6、再重新随机选择立体图像集合中的幅立体图像构成训练集,将立体图像集合中剩余的n-t幅立体图像构成测试集,然后返回步骤⑧-2继续执行,在经过N次迭代后,计算立体图像集合中的每幅立体图像的客观视觉舒适度评价预测值的平均值,再将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度评价预测值,其中,N的值取大于100。
所述的步骤⑧-3中取γ=54。
与现有技术相比,本发明的优点在于:
1)本发明方法考虑到视觉重要区域对视觉舒适度的影响,因此根据立体图像的右视点图像的显著图和立体图像的右视差图像提取出立体图像的视觉重要区域掩膜,然后根据视觉重要区域掩膜只对视觉重要区域进行评价,从而有效地提高了客观评价结果与主观感知的相关性。
2)本发明方法根据用于反映立体图像的右视差图像的视差幅度特征的特征矢量、用于反映立体图像的右视差图像的视差梯度特征的特征矢量、用于反映立体图像的右视点图像的空间频率特征的特征矢量,得到立体图像的特征矢量,然后利用支持向量回归对立体图像集合中的所有立体图像的特征矢量进行训练,计算得到立体图像集合中的每幅立体图像的客观视觉舒适度评价预测值,由于获得的立体图像的特征矢量信息具有较强的稳定性且能够较好地反映立体图像的视觉舒适度变化情况,因此有效地提高了客观评价情况与主观感知的相关性。
附图说明
图1为本发明方法的总体实现框图;
图2a为“camera”的右视点图像;
图2b为“camera”的右视差图像;
图2c为“camera”的右视点图像的显著图;
图2d为“camera”的右视点图像的视觉显著图;
图2e为“camera”的视觉重要区域掩模;
图3a为“cup”的右视点图像;
图3b为“cup”的右视差图像;
图3c为“cup”的右视点图像的显著图;
图3d为“cup”的右视点图像的视觉显著图;
图3e为“cup”的视觉重要区域掩模;
图4a为“infant”的右视点图像;
图4b为“infant”的右视差图像;
图4c为“infant”的右视点图像的显著图;
图4d为“infant”的右视点图像的视觉显著图;
图4e为“infant”的视觉重要区域掩模;
图5为根据F1和F2两个特征矢量获得的客观视觉舒适度评价预测值与平均主观评分均值的散点图;
图6为根据F1和F3两个特征矢量获得的客观视觉舒适度评价预测值与平均主观评分均值的散点图;
图7为根据F2和F3两个特征矢量获得的客观视觉舒适度评价预测值与平均主观评分均值的散点图;
图8为根据F1、F2和F3三个特征矢量获得的客观视觉舒适度评价预测值与平均主观评分均值的散点图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种基于机器学习的立体图像视觉舒适度评价方法,其总体实现框图如图1所示,其包括以下步骤:
①将待评价的立体图像的左视点图像记为{IL(x,y)},将待评价的立体图像的右视点图像记为{IR(x,y)},将待评价的立体图像的右视差图像记为{dR(x,y)},其中,此处(x,y)表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}的宽度,H表示{IL(x,y)}、{IR(x,y)}和{dR(x,y)}的高度,IL(x,y)表示{IL(x,y)}中坐标位置为(x,y)的像素点的像素值,IR(x,y)表示{IR(x,y)}中坐标位置为(x,y)的像素点的像素值,dR(x,y)表示{dR(x,y)}中坐标位置为(x,y)的像素点的像素值。
②提取出{IR(x,y)}的显著图;然后根据{IR(x,y)}的显著图和{dR(x,y)},获取{IR(x,y)}的视觉显著图;再将{IR(x,y)}的视觉显著图划分为视觉重要区域和非视觉重要区域;最后根据{IR(x,y)}的视觉显著图的视觉重要区域和非视觉重要区域,获取待评价的立体图像的视觉重要区域掩膜,记为{M(x,y)},其中,M(x,y)表示{M(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤②的具体过程为:
②-1、采用基于图论的视觉显著性(Graph-based Visual Saliency,GBVS)模型提取出{IR(x,y)}的显著图,记为{SMR(x,y)},其中,SMR(x,y)表示{SMR(x,y)}中坐标位置为(x,y)的像素点的像素值。
②-2、根据{SMR(x,y)}和{dR(x,y)},获取{IR(x,y)}的视觉显著图,记为{DR(x,y)},将{DR(x,y)}中坐标位置为(x,y)的像素点的像素值记为DR(x,y),其中,
表示SMR(x,y)的权重,
表示dR(x,y)的权重,
在此取
②-3、根据{DR(x,y)}中的每个像素点的像素值,将{DR(x,y)}划分为视觉重要区域和非视觉重要区域,{DR(x,y)}的视觉重要区域中的每个像素点的像素值大于自适应阈值T1,{DR(x,y)}的非视觉重要区域中的每个像素点的像素值小于或等于自适应阈值T1,其中,T1为利用大津法对{DR(x,y)}进行处理得到的阈值。
②-4、根据{DR(x,y)}的视觉重要区域和非视觉重要区域,获取待评价的立体图像的视觉重要区域掩膜,记为{M(x,y)},将{M(x,y)}中坐标位置为(x,y)的像素点的像素值记为M(x,y),
在此,截取三组典型的立体图像来说明本发明方法中获取的待评价的立体图像的视觉重要区域掩膜的性能。图2a和图2b分别给出了“camera”的右视点图像和右视差图像,图2c给出了“camera”的右视点图像的显著图,图2d给出了“camera”的右视点图像的视觉显著图,图2e给出了“camera”的视觉重要区域掩模;图3a和图3b分别给出了“cup”的右视点图像和右视差图像,图3c给出了“cup”的右视点图像的显著图,图3d给出了“cup”的右视点图像的视觉显著图,图3e给出了“cup”的视觉重要区域掩模;图4a和图4b分别给出了“infant”的右视点图像和右视差图像,图4c给出了“infant”的右视点图像的显著图,图4d给出了“infant”的右视点图像的视觉显著图,图4e给出了“infant”的视觉重要区域掩模。从图2e、图3e和图4e可以看出,采用本发明方法得到的视觉重要区域,能够很好地反映人眼视觉舒适程度。
③根据{dR(x,y)}和{M(x,y)},获取{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的视差均值μ、视差方差δ、最大负视差θ、视差范围χ,然后将μ、δ、θ和χ按顺序进行排列构成用于反映{dR(x,y)}的视差幅度特征的特征矢量,记为F1,F1=(μ,δ,θ,χ)。
在此具体实施例中,步骤③的具体过程为:
③-1、根据{dR(x,y)}和{M(x,y)},计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的视差均值,记为μ,
③-2、根据{dR(x,y)}和{M(x,y)}及μ,计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的视差方差,记为δ,
③-3、计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的最大负视差,记为θ,其中,θ的值为{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最小的1%像素点的视差均值。
③-4、计算{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的视差范围,记为χ,χ=dmax-dmin,其中,dmax表示{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最大的1%像素点的视差均值,dmin表示{dR(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内视差值最小的1%像素点的视差均值。
③-5、将μ、δ、θ和χ按顺序进行排列构成用于反映{dR(x,y)}的视差幅度特征的特征矢量,记为F1,F1=(μ,δ,θ,χ),F1的维数为4。
④通过计算{dR(x,y)}的视差梯度幅值图像和视差梯度方向图像,计算{dR(x,y)}的视差梯度边缘图像;然后根据{dR(x,y)}的视差梯度边缘图像和{M(x,y)},计算{dR(x,y)}的视差梯度边缘图像中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的梯度均值ψ;最后将ψ作为用于反映{dR(x,y)}的视差梯度特征的特征矢量,记为F2。
在此具体实施例中,步骤④的具体过程为:
④-1、计算{dR(x,y)}的视差梯度幅值图像,记为{m(x,y)},将{m(x,y)}中坐标位置为(x,y)的像素点的梯度幅值记为m(x,y),其中,Gx(x,y)表示{m(x,y)}中坐标位置为(x,y)的像素点的水平梯度值,Gy(x,y)表示{m(x,y)}中坐标位置为(x,y)的像素点的垂直梯度值。
④-2、计算{dR(x,y)}的视差梯度方向图像,记为{θ(x,y)},将{θ(x,y)}中坐标位置为(x,y)的像素点的梯度方向值记为θ(x,y),θ(x,y)=arctan(Gy(x,y)/Gx(x,y)),其中,arctan()为取反正切函数。
④-3、根据{m(x,y)}和{θ(x,y)},计算{dR(x,y)}的视差梯度边缘图像,记为{E(x,y)},将{E(x,y)}中坐标位置为p的像素点的梯度边缘值记为E(p),其中,Gs(||p-q||)表示标准差为σs的高斯函数,在此取σs=0.4,
||p-q||表示坐标位置p和坐标位置q之间的欧氏距离,符号“|| ||”为求欧氏距离符号,
表示标准差为σo的高斯函数,在此取σo=0.4,
与
之间的欧氏距离,
θ(p)表示{θ(x,y)}中坐标位置为p的像素点的梯度方向值,θ(q)表示{θ(x,y)}中坐标位置为q的像素点的梯度方向值,
m(q)表示{m(x,y)}中坐标位置为q的像素点的梯度幅值,m(q')表示{m(x,y)}中坐标位置为q'的像素点的梯度幅值,εg为控制参数,在此取εg=0.5,符号“[]”为矢量表示符号,exp()表示以e为底的指数函数,e=2.71828183,
表示以坐标位置为p的像素点为中心的邻域窗口,
表示以坐标位置为q的像素点为中心的邻域窗口,在此
的大小为3×3,
的大小为3×3。
④-4、根据{E(x,y)}和{M(x,y)},计算{E(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的梯度均值,记为ψ,其中,Ω表示图像域范围,E(x,y)表示{E(x,y)}中坐标位置为(x,y)的像素点的梯度边缘值。
④-5、将ψ作为用于反映{dR(x,y)}的视差梯度特征的特征矢量,记为F2,F2的维数为1。
⑤获取{IR(x,y)}的空间频率图像;然后根据{IR(x,y)}的空间频率图像和{M(x,y)},获取{IR(x,y)}的空间频率图像中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率均值ν、空间频率方差ρ、空间频率范围ζ、空间频率敏感因子τ;再将ν、ρ、ζ和τ按顺序进行排列构成用于反映{IR(x,y)}的空间频率特征的特征矢量,记为F3,F3=(ν,ρ,ζ,τ)。
在此具体实施例中,步骤⑤的具体过程为:
⑤-1、计算{IR(x,y)}的空间频率图像,记为{SF(x,y)},将{SF(x,y)}中坐标位置为(x,y)的像素点的空间频率值记为SF(x,y),
⑤-2、根据{SF(x,y)}和{M(x,y)},计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的空间频率均值,记为ν,
⑤-3、根据{SF(x,y)}和{M(x,y)}及ν,计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的所有像素点的空间频率方差,记为ρ,
⑤-4、计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率范围,记为ζ,ζ=SFmax-SFmix,其中,SFmax表示{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内空间频率值最大的1%像素点的空间频率均值,SFmin表示{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内空间频率值最小的1%像素点的空间频率均值。
⑤-5、计算{SF(x,y)}中与{IR(x,y)}的视觉显著图的视觉重要区域相对应的区域内的像素点的空间频率敏感因子,记为τ,τ=ν/μ。
⑤-6、将ν、ρ、ζ和τ按顺序进行排列构成用于反映{IR(x,y)}的空间频率特征的特征矢量,记为F3,F3=(ν,ρ,ζ,τ),F3的维数为4。
⑥将F1、F2及F3构成一个新的特征矢量,记为X,X=[F1,F2,F3],然后将X作为待评价的立体图像的特征矢量,其中,符号“[]”为矢量表示符号,[F1,F2,F3]表示将F1、F2和F3连接起来形成一个新的特征矢量。
⑦采用n副不同的立体图像以及对应的右视差图像建立立体图像集合,利用现有的主观质量评价方法分别计算立体图像集合中的每副立体图像的视觉舒适度的平均主观评分均值,记为MOS,其中,n≥1,MOS∈[1,5];然后按照步骤①至步骤⑥计算待评价的立体图像的特征矢量X的操作,以相同的方式分别计算立体图像集合中的每幅立体图像的特征矢量,将立体图像集合中的第i幅立体图像的特征矢量记为Xi,其中,1≤i≤n,n表示立体图像集合中包含的立体图像的幅数。
在本实施例中,采用韩国科学技术院图像和视频系统实验室提供的立体图像数据库作为立体图像集合,该立体图像数据库包含120幅立体图像以及对应的右视差图像,该立体图像数据库包含了各种场景深度的室内和室外图像,并给出了每副立体图像的视觉舒适度的平均主观评分均值。
⑧将立体图像集合中的所有立体图像分成训练集和测试集,将训练集中的所有立体图像的特征矢量和平均主观评分均值构成训练样本数据集合,将测试集中的所有立体图像的特征矢量和平均主观评分均值构成测试样本数据集合,然后采用支持向量回归作为机器学习的方法,对训练样本数据集合中的所有立体图像的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小,拟合得到最优的权重矢量wopt和最优的偏置项bopt,接着利用wopt和bopt构造得到支持向量回归训练模型,再根据支持向量回归训练模型,对测试样本数据集合中的每幅立体图像的特征矢量进行测试,预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,将测试样本数据集合中的第k'幅立体图像的客观视觉舒适度评价预测值记为Qk',Qk'=f(Xk'),其中,f()为函数表示形式,Xk'表示测试样本数据集合中的第k'幅立体图像的特征矢量,(wopt)T为wopt的转置矩阵,
表示测试样本数据集合中的第k'幅立体图像的线性函数,1≤k'≤n-t,t表示训练集中包含的立体图像的幅数;之后通过重新分配训练集和测试集,重新预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,经过N次迭代后计算立体图像中的每幅立体图像的客观视觉舒适度评价预测值的平均值,并将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度预测值,其中,N的值取大于100,以保证立体图像集合中的每幅立体图像都能得到客观视觉舒适度评价预测值,在本实施例中取N=200。
在此具体实施例中,步骤⑧的具体过程为:
⑧-1、随机选择立体图像集合中的幅立体图像构成训练集,将立体图像集合中剩余的n-t幅立体图像构成测试集,其中,符号
为向上取整符号。
⑧-2、将训练集中的所有立体图像的特征矢量和平均主观评分均值构成训练样本数据集合,记为Ωt,{Xk,MOSk}∈Ωt,其中,Xk表示训练样本数据集合Ωt中的第k幅立体图像的特征矢量,MOSk表示训练样本数据集合Ωt中的第k幅立体图像的平均主观评分均值,1≤k≤t。
⑧-3、构造训练样本数据集合Ωt中的每幅立体图像的特征矢量的回归函数,将Xk的回归函数记为f(Xk),其中,f()为函数表示形式,w为权重矢量,wT为w的转置矩阵,b为偏置项,w和b的值需要通过训练来得到,
表示Xk的线性函数,
D(Xk,Xl)为支持向量回归中的核函数,
Xl为训练样本数据集合Ωt中的第l幅立体图像的特征矢量,1≤l≤t,γ为核参数,其用于反映输入样本值的范围,样本值的范围越大,γ值也就越大,在本实施例中取γ=54,exp()表示以e为底的指数函数,e=2.71828183,符号“|| ||”为求欧式距离符号。
⑧-4、采用支持向量回归对训练样本数据集合Ωt中的所有立体图像的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观评分均值之间的误差最小,拟合得到最优的权重矢量wopt和最优的偏置项bopt,将最优的权重矢量wopt和最优的偏置项bopt的组合记为(wopt,bopt),其中,Ψ表示对训练样本数据集合Ωt中的所有立体图像的特征矢量进行训练的所有的权重矢量和偏置项的组合的集合,
表示支持向量回归训练模型的输入矢量Xinp的线性函数。
⑧-5、将测试集中的所有立体图像的特征矢量和平均主观评分均值构成测试样本数据集合,然后根据支持向量回归训练模型,对测试样本数据集合中的每幅立体图像的特征矢量进行测试,预测得到测试样本数据集合中的每幅立体图像的客观视觉舒适度评价预测值,将测试样本数据集合中的第k'幅立体图像的客观视觉舒适度评价预测值记为Qk',Qk'=f(Xk'),其中,Xk'表示测试样本数据集合中的第k'幅立体图像的特征矢量,
表示测试样本数据集合中的第k'幅立体图像的线性函数,1≤k'≤n-t。
⑧-6、再重新随机选择立体图像集合中的幅立体图像构成训练集,将立体图像集合中剩余的n-t幅立体图像构成测试集,然后返回步骤⑧-2继续执行,在经过N次迭代后,计算立体图像集合中的每幅立体图像的客观视觉舒适度评价预测值的平均值,再将计算得到的平均值作为对应那幅立体图像的最终的客观视觉舒适度评价预测值,其中,N的值取大于100。
在本实施例中,利用评估图像质量评价方法的4个常用客观参量作为评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient,PLCC)、Spearman相关系数(Spearman rank order correlation coefficient,SROCC)、Kendall相关系数(Kendall rank-order correlation coefficient,KROCC)、均方误差(root mean squarederror,RMSE),PLCC和RMSE反映客观评价预测值的准确性,SROCC和KROCC反映其单调性。将计算得到的120幅立体图像的视觉舒适度客观评价预测值做五参数Logistic函数非线性拟合,PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明的视觉舒适度客观评价方法的评价结果与平均主观评分均值的相关性越好。表1给出了采用不同特征矢量得到的视觉舒适度评价预测值与平均主观评分均值之间的相关性,从表1中可以看出,只采用两个特征矢量得到的视觉舒适度评价预测值与平均主观评分均值之间的相关性均不是最优的,并且由视差幅度特征构成的特征矢量对评价性能的影响比其他两个特征矢量要大,这说明了本发明方法提取的三个特征矢量是有效的,并且结合视差幅度、视差梯度和空间频率特征的特征矢量,得到的视觉舒适度评价预测值与平均主观评分均值之间的相关性更强,这足以说明本发明方法是有效的。
图5给出了采用F1和F2两个特征矢量得到的客观视觉舒适度评价预测值与平均主观评分均值的散点图,图6给出了采用F1和F3两个特征矢量得到的客观视觉舒适度评价预测值与平均主观评分均值的散点图,图7给出了采用F2和F3两个特征矢量得到的客观视觉舒适度评价预测值与平均主观评分均值的散点图,图8给出了采用F1、F2和F3三个特征矢量得到的客观视觉舒适度评价预测值与平均主观评分均值的散点图,散点图中的散点越集中,说明客观评价结果与主观感知的一致性越好。从图5至图8中可以看出,采用本发明方法得到的散点图中的散点比较集中,与主观评价数据之间的吻合度较高。
表1采用不同特征矢量得到的视觉舒适度评价预测值与平均主观评分均值之间的相关
性