要实现独立源信息的分离,Aapo Hyvärinen等提出了非高斯性假设,并基于此建立了能远离高斯分布的目标准则。通过优化准则,来反向将信息源信息分离。
具体来说,假定采集到的数据是由个随机向量
,而
个独立的源分量为
,经典的独立分量分析假定采集到的数据是由源分量线性组合而成,即
。式中
为线性变换矩阵。目标函数是寻找
的逆变换,使得:
,并满足独立分量之间相互独立的条件。独立性由某个准则来判定。
独立元分析最早起源于鸡尾酒问题 (cocktail party problem)。即,人在鸡尾酒会中,可以轻松地分离出聊天的人群中想关注的人声,而忽略其他不关注的声音。而如果用麦克风收音,计算机却很难对混合后的声音实现类似人声分离的能力。完成这一分离的研究,俗称盲源分离。它在音乐乐器声分离、人声分离及图像中都重要的应用。最早常采用独立分量分析方法及其变种进行分离。其难点在于独立源的特性(如数量、位置等)未知,逆向寻找是个病态问题,无法找到唯一解或最优解,只能找到近优解。
随着大数据获得更为方便,在某些应用领域已经开始用深度学习来分别学习不同的独立源,并通过权值共享、源标签等保持以及对抗学习技术来实现盲源分离,已经取得好的效果。但在数据集规模偏小的领域,采用独立元分析及其变种仍然是简单有效的方法。