在稀疏表示理论未提出前,正交字典和双正交字典因其数学模型简单而被广泛的应用,然而它们自适应能力差,不能灵活全面地表示信号。1993年,Mallat基于小波分析提出信号可以用一个超完备字典进行表示,从而开启了稀疏表示的先河。
在信息处理领域,信号稀疏表示即在给定的超完备字典中用尽可能少的原子来表示信号,可以获得信号更为简洁的表示方式,从而使得获取信号中所蕴含的信息更为容易,更方便进一步对信号进行加工处理,如压缩、编码等。
在机器学习任务中,稀疏表示的思想体现在字典学习中,亦称“稀疏编码”。字典学习描述如下:为简化学习任务,降低模型的复杂度,需要为普通稠密表达的样本找到合适的字典,将样本转化为合适的稀疏表示形式。
给定数据集,字典学习可表示为:
式中:为字典矩阵,
称为字典的词汇量,通常由用户指定,
则是样本
的稀疏表示,上式第一项希望
能很好的重构
,第二项则是希望
尽量稀疏。
稀疏表示目前主要应用于自然信号形成的图像、音频以及文本等领域。大体可划分为两类:①基于重构的应用,如图像去噪、压缩与超分辨SAR成像、缺失图像重构以及音频修复等;②基于分类的应用,此类应用的本质为模式识别,如盲源分离、音乐表示与分类、人脸识别、文本检测等。