To love and win is the best thing. To love and lose is the next best thing.

Image Quality Assessment

发表于 2025-06-07

图像质量评估概述

参考资料：

DeepSeek

简介

Image Quality Assessment (IQA)，即图像质量评估，是计算机视觉和图像处理领域的一个重要研究方向，旨在通过算法自动评估图像的质量，模拟人类视觉系统（HVS）对图像的主观感知。其核心任务是量化图像的失真程度或感知质量，广泛应用于图像压缩、传输、增强、修复等场景。

分类

全参考 (Full-Reference, FR-IQA)

需要完整的原始无失真图像作为参考，通过对比失真图像与参考图像的差异来量化质量。

典型方法

PSNR（峰值信噪比）

PSNR 基于均方误差（MSE, Mean Squared Error）计算，单位为分贝（dB），值越大表示图像质量越好。

$PSNR = 10 \cdot \log_{10} \left( \frac{MAX_I^2}{MSE} \right)$

$MAX_I$：图像像素的最大可能值（如8位图像为255）。

$MSE$：均方误差，计算两图像像素差的平方均值：

$MSE = \frac{1}{MN} \sum_{i=0}^{M - 1} \sum_{j=0}^{N - 1} [I(i, j) - K(i, j)]^2$

$I$：原始图像。$K$：失真图像。

优点：计算简单、物理意义明确、通用性强
局限性：对局部失真不敏感、依赖参考图像、对图像内容不敏感

SSIM（结构相似性）

SSIM 认为，人眼对图像的亮度（Luminance）、对比度（Contrast） 和 结构（Structure） 三个维度最为敏感，因此分别计算这三者的相似度，再综合得到最终评分：

$SSIM(x, y) = [l(x, y)]^{\alpha}[c(x, y)]^{\beta}[s(x, y)]^{\gamma}$

$x$为参考图像，$y$为失真图像。

$l(x, y), c(x, y), s(x, y)$分别为亮度相似度、对比度相似度、结构相似度。

$\alpha, \beta, \gamma$通常设为1 。

$SSIM(x, y) = \frac{(2 \mu_x \mu_y + C_1)(2 \sigma_{xy} + C_2)}{(\mu_x^2 + \mu_y^2 + C_1)(\sigma_x^2 + \sigma_y^2 + C_2)}$

$\mu_x, \mu_y$：图像的均值（亮度）。

$\sigma_x, \sigma_y$：图像标准差（对比度）。

$\sigma_{xy}$：协方差（结构相似性）。

$C_1, C_2$：防止分母为0的小常数。

优点：更符合人眼感知、多维度评估、鲁棒性强
缺点：计算复杂度高、不适用于极端失真、依赖参考图像

MS-SSIM（多尺度SSIM）

在多分辨率下计算SSIM，更适合复杂失真。

VIF（视觉信息保真度）

VIF 将图像视为信息源，将人类视觉系统视为通信信道，通过计算参考图像和失真图像通过HVS（人类视觉系统）信道后的互信息（Mutual Information）来评估质量。

优点：符合人类感知、多尺度分析、信息论基础、对复杂失真敏感
缺点：计算复杂度高、依赖参数调优、对某些失真不敏感

部分参考 (Reduced-Reference, RR-IQA)

仅需原始图像的部分特征（如统计特征、频域信息），而非完整图像。

典型方法

基于频域特征：如DCT系数、小波变换能量分布。
基于自然场景统计 (NSS)：如提取原始图像的梯度分布、熵特征。

无参考 (No-Reference, NR-IQA)

无需任何参考图像，直接评估失真图像的质量。

典型方法

传统方法：
- BRISQUE：基于空间域自然场景统计。
- NIQE：利用多元高斯模型拟合图像特征。
深度学习方法：
- CNN-based：如WaDIQaM、HyperIQA。
- Transformer-based：如TranSLA、ViTQA。

简介

分类

全参考 (Full-Reference, FR-IQA)

典型方法

PSNR（峰值信噪比）

SSIM（结构相似性）

MS-SSIM（多尺度SSIM）

VIF（视觉信息保真度）

部分参考 (Reduced-Reference, RR-IQA)

典型方法

无参考 (No-Reference, NR-IQA)

典型方法

Paper reading