参考资料:
Awesome Image Quality Assessment (IQA)
DeepSeek
简介
Image Quality Assessment (IQA),即图像质量评估,是计算机视觉和图像处理领域的一个重要研究方向,旨在通过算法自动评估图像的质量,模拟人类视觉系统(HVS)对图像的主观感知。其核心任务是量化图像的失真程度或感知质量,广泛应用于图像压缩、传输、增强、修复等场景。
分类
全参考 (Full-Reference, FR-IQA)
需要完整的原始无失真图像作为参考,通过对比失真图像与参考图像的差异来量化质量。
典型方法
PSNR(峰值信噪比)
PSNR 基于均方误差(MSE, Mean Squared Error)计算,单位为分贝(dB),值越大表示图像质量越好。
$MAX_I$:图像像素的最大可能值(如8位图像为255)。
$MSE$:均方误差,计算两图像像素差的平方均值:
$I$:原始图像。$K$:失真图像。
- 优点:计算简单、物理意义明确、通用性强
- 局限性:对局部失真不敏感、依赖参考图像、对图像内容不敏感
SSIM(结构相似性)
SSIM 认为,人眼对图像的亮度(Luminance)、对比度(Contrast) 和 结构(Structure) 三个维度最为敏感,因此分别计算这三者的相似度,再综合得到最终评分:
$x$为参考图像,$y$为失真图像。
$l(x, y), c(x, y), s(x, y)$分别为亮度相似度、对比度相似度、结构相似度。
$\alpha, \beta, \gamma$通常设为1 。
$\mu_x, \mu_y$:图像的均值(亮度)。
$\sigma_x, \sigma_y$:图像标准差(对比度)。
$\sigma_{xy}$:协方差(结构相似性)。
$C_1, C_2$:防止分母为0的小常数。
- 优点:更符合人眼感知、多维度评估、鲁棒性强
- 缺点:计算复杂度高、不适用于极端失真、依赖参考图像
MS-SSIM(多尺度SSIM)
在多分辨率下计算SSIM,更适合复杂失真。
VIF(视觉信息保真度)
VIF 将图像视为信息源,将人类视觉系统视为通信信道,通过计算参考图像和失真图像通过HVS(人类视觉系统)信道后的互信息(Mutual Information)来评估质量。
- 优点:符合人类感知、多尺度分析、信息论基础、对复杂失真敏感
- 缺点:计算复杂度高、依赖参数调优、对某些失真不敏感
部分参考 (Reduced-Reference, RR-IQA)
仅需原始图像的部分特征(如统计特征、频域信息),而非完整图像。
典型方法
- 基于频域特征:如DCT系数、小波变换能量分布。
- 基于自然场景统计 (NSS):如提取原始图像的梯度分布、熵特征。
无参考 (No-Reference, NR-IQA)
无需任何参考图像,直接评估失真图像的质量。
典型方法
- 传统方法:
- BRISQUE:基于空间域自然场景统计。
- NIQE:利用多元高斯模型拟合图像特征。
- 深度学习方法:
- CNN-based:如WaDIQaM、HyperIQA。
- Transformer-based:如TranSLA、ViTQA。