Image Quality Assessment

参考资料:

图像质量评价(一):IQA介绍

Awesome Image Quality Assessment (IQA)

DeepSeek

简介

Image Quality Assessment (IQA),即图像质量评估,是计算机视觉和图像处理领域的一个重要研究方向,旨在通过算法自动评估图像的质量,模拟人类视觉系统(HVS)对图像的主观感知。其核心任务是量化图像的失真程度或感知质量,广泛应用于图像压缩、传输、增强、修复等场景。

分类

全参考 (Full-Reference, FR-IQA)

需要完整的原始无失真图像作为参考,通过对比失真图像与参考图像的差异来量化质量。

典型方法

PSNR(峰值信噪比)

PSNR 基于均方误差(MSE, Mean Squared Error)计算,单位为分贝(dB),值越大表示图像质量越好。

$MAX_I$:图像像素的最大可能值(如8位图像为255)。

$MSE$:均方误差,计算两图像像素差的平方均值:

$I$:原始图像。$K$:失真图像。

  • 优点:计算简单、物理意义明确、通用性强
  • 局限性:对局部失真不敏感、依赖参考图像、对图像内容不敏感

SSIM(结构相似性)

SSIM 认为,人眼对图像的亮度(Luminance)对比度(Contrast)结构(Structure) 三个维度最为敏感,因此分别计算这三者的相似度,再综合得到最终评分:

$x$为参考图像,$y$为失真图像。

$l(x, y), c(x, y), s(x, y)$分别为亮度相似度、对比度相似度、结构相似度。

$\alpha, \beta, \gamma$通常设为1 。

$\mu_x, \mu_y$:图像的均值(亮度)。

$\sigma_x, \sigma_y$:图像标准差(对比度)。

$\sigma_{xy}$:协方差(结构相似性)。

$C_1, C_2$:防止分母为0的小常数。

  • 优点:更符合人眼感知、多维度评估、鲁棒性强
  • 缺点:计算复杂度高、不适用于极端失真、依赖参考图像

MS-SSIM(多尺度SSIM)

在多分辨率下计算SSIM,更适合复杂失真。

VIF(视觉信息保真度)

VIF 将图像视为信息源,将人类视觉系统视为通信信道,通过计算参考图像和失真图像通过HVS(人类视觉系统)信道后的互信息(Mutual Information)来评估质量。

  • 优点:符合人类感知、多尺度分析、信息论基础、对复杂失真敏感
  • 缺点:计算复杂度高、依赖参数调优、对某些失真不敏感

部分参考 (Reduced-Reference, RR-IQA)

仅需原始图像的部分特征(如统计特征、频域信息),而非完整图像。

典型方法

  • 基于频域特征:如DCT系数、小波变换能量分布。
  • 基于自然场景统计 (NSS):如提取原始图像的梯度分布、熵特征。

无参考 (No-Reference, NR-IQA)

无需任何参考图像,直接评估失真图像的质量。

典型方法

  • 传统方法
    • BRISQUE:基于空间域自然场景统计。
    • NIQE:利用多元高斯模型拟合图像特征。
  • 深度学习方法
    • CNN-based:如WaDIQaM、HyperIQA。
    • Transformer-based:如TranSLA、ViTQA。

Paper reading