根据离散傅里叶变换的性质,实偶函数的傅里叶变换只含实的余弦项,因此构造了一种实数域的变换—离散余弦变换(DCT)。设的图像子块为
,其离散余弦变换(DCT)可以由下式表示:
(1) |
式(1)中
其逆变换为:
(2) |
DCT基本函数的水平频率从左至右增长,垂直频率从上到下增长。位于图像左上方的定值基本函数被称为直流(DC)基本函数。像DFT一样,DCT可以用快速算法来计算。
通过研究发现,DCT除了具有一般的正交变换性质外,其变换阵的基向量很近似于Toeplitz矩阵的特征向量,后者体现了人类的语言、图像信号的相关特性。因此,在对语音、图像信号变换的确定的变换矩阵正交变换中,DCT变换被认为是一种准最佳变换。在已颁布的一系列视频压缩编码的国际标准建议中,都把DCT作为其中的一个基本处理模块。
DCT除了实数变换、确定的变换矩阵、准最佳变换性能外,二维DCT还是一种可分离的变换,可以用两次一维变换得到二维变换结果。另外,改进的离散余弦变换(modified discrete cosine transform ,MDCT),它相当于对交叠的数据进行离散余弦变换,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的“能量集中”特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换的性能。
在静止图像编码标准JPEG和运动图像编码标准MJPEG和MPEG的各个标准中都使用了离散余弦变换,并将结果量化之后进行熵编码。经改进的离散余弦变换已被用在高级音频编码和MP3音频压缩当中。