1、什么是稀疏表示

官方的说法:任意一个信号都可以在一个过完备字典上稀疏线性表出。这样,一个信号被分解为有限个信号的线形组合的形式我们称之为稀疏表示。 $$y = Dα s.t.||α||0 < σ$$ 其中y就表示任意信号,D表示过完备字典,α表示系数矩阵,Dα就是二者的点乘,s.t.表示subject to的缩写,我们所说的稀疏就是α中非零系数的数量很少,即绝大部分α中的系数都为0,如何用数学公式约束呢?就是||α||0 < σ,其中小于符号前一部分是α的第0范数,所谓范数就是距离的一种,现实中的A到B的距离就是第二范数,α的第0范数指的是α中非零元数的数量,整体来说就是α中非零元素的数量之和小于一个约定好的数σ。

1.1、稀疏

首先我们说到中国古典四大名著之一的《红楼梦》,全篇120回,一共用了731,017个汉字。新华字典是我们每个人小学都人手必备的工具书,共收录了11,200个汉字,虽然二者字数相差了将近70倍,但我们每个人都知道,《红楼梦》中出现的每一个汉字都能从《新华字典》里找到,并且如果大家仔细想想的话,《红楼梦》一定没有用完一本《新华字典》中收录的每一个汉字,综上我们可以说:一套《红楼梦》中所有的汉字都能在《新华字典》中找到,并且《新华字典》中一定有《红楼梦》没用到的汉字。

基于这个例子我们把“能找到”翻译成线性表示,把“一定有没用过的字”翻译成稀疏,这样的话是不是对我们文章开始所提到的定义有一点理解。

svd 你怎么能从人群中认出你最好的朋友,你怎么能在很多年不见之后一眼就认出你的年轻时候的朋友?这时候有的朋友可能会说啦,“因为他下巴这有颗痣”,“因为他鼻子特别大”,“因为他秃啦”,等等。这些都对,我们可总结一下,我们只需要记住特定的几个专属于朋友的特征就能认出你的朋友,因为一张脸上有无数的东西可以记住,用掉书袋的话说,脸是连续的,有无数个特征,但你只需要记住很少的特征你就能认出你的朋友。那么这样的问题我们同样用上面的话总结一下:只需要从脸上找到有限个标志特征就能识别出一个人。同样的我们将“识别出人”看作是线形表出,“有限个”说成稀疏,这也是我们一开始提到的那句话一种理解。

这一次我们加深一步,我们将上一句话换个说法:人脸在面部特征识别的空间中是稀疏的。说白了也是同一个意思,面部特征识别空间就是我要认出一个人,也就是说我想认出一个人只需要有限个特征,而这有限个特征相较于拥有无限特征的脸来说,是稀疏的。这样将第一个例子扩张,也就变成了:任意一本中文书在《新华字典》的收录汉字空间中是稀疏的。然后我们自然推广(高中数学知识),假设存在这样一个信号的字典,它也像《新华字典》一样收录了各种基本信号,那么我们也能说:任意一个信号都是这个信号字典中基本信号组合而成,并且任意一个信号不会用到其中的每一个基信号。抑或是:信号在信号字典的特征空间内是稀疏的。这就是本文一开始提到的定义的通俗理解。

1.2、过完备

过完备的意思就是字典中信号的个数要远远大于信号的长度。其实过完备和稀疏是相辅相成的,只有m足够大,才能实现只用极少的原子表示一个信号。