跳转到内容

压缩感知

本页使用了标题或全文手工转换
维基百科,自由的百科全书

压缩感知(Compressed sensing),也被称为压缩采样(Compressive sampling)或稀疏采样(Sparse sampling),是一种寻找欠定线性系统英语Underdetermined system的稀疏解的技术。压缩感知被应用于电子工程尤其是信号处理中,用于获取和重构稀疏或可压缩的信号。这个方法利用信号稀疏的特性,相较于奈奎斯特理论,得以从较少的测量值还原出原来整个欲得知的信号。核磁共振就是一个可能使用此方法的应用。这一方法至少已经存在了四十年,由于Emmanuel Candès英语Emmanuel Candès戴维·多诺霍、Justin Romberg和陶哲轩的工作,最近这个领域有了长足的发展。

概览

[编辑]

信号处理领域中的一个常见问题就是从一系列的采样中重建原本的信号。一般而言,未被采样的部分信号,是不可能重建出来的。然而通过借助对于信号(性质)的预先了解或合理假设,完美地通过一系列采样重建原信号就成为了可能。随着科学的发展,数学家们逐步增进了如何作出合理假设的能力,并慢慢了解到在何种情况下可将这些假设一般化、推广化。

信号处理领域中的一次较早的突破是奈奎斯特采样定理的提出。这一定理证明了若信号的最高频率小于采样频率的一半,便可完美地从采样结果中恢复原本信号,因此定义了采样定理采样率的下限。这种数据获取模式先采样再压缩,需要大量的时间压缩和空间存储数据,这限制了高速信号处理的发展,也给硬件的实时处理带来了极大的挑战。

在2006年左右,Emmanuel Candès英语Emmanuel Candès戴维·多诺霍、Justin Romberg和陶哲轩证明了在已知信号稀疏性的情况下,可能凭借较采样定理所规定更少的采样数重建原信号,这一理论也是压缩感知的基石。

正交基展开(orthogonal basis expansion)采用的是完全正交基(complete and orthogonal basis set)来进行展开,而压缩感知采用的是过完备的非正交基集(over-complete and non-orthogonal basis set)来展开信号。

示例

[编辑]

傅立叶级数展开是正交基展开(orthogonal basis expansion)的方法:

if

Three-parameter atom expansion,Four-parameter atom (chirplet) expansion,

PSWF 展开则是过完备的非正交基集展开(over-complete and non-orthogonal basis expansion)的方法:

(t) 不构成一个完备的正交基集。

分类

[编辑]

压缩感知希望处理的问题是:

假设 组成一个过完备的非正交基集

问题一

[编辑]

我们希望最小化 ( 范数, 意指 的值不为0 的个数),使得:

问题二

[编辑]

我们希望最小化 ,使得:

问题三

[编辑]

限制 为 M,我们想要最小化:

方法

[编辑]

方法一:匹配追踪(贪心算法)

[编辑]

原子:

(归一化)

[第1步]输入:,初始化:

[第2步]找到最小化的m

[第3步]令

[第4步]

[第5步]

[第6步]检查下列条件是否符合,若不符合,回到[第2步];若符合,则进到[第7步]

问题一:是否满足

问题二:是否满足

问题三:是否满足

[第7步]

方法二:基追踪(Basis Pursuit)

[编辑]

范数改为 范数

问题一:

我们想要最小化 ,使得:

问题二:

我们想要最小化 ,使得:

问题三:

,我们想要最小化:

问题定义

[编辑]

一般来说,一个常见的线性系统问题,有m个方程式, n个未知数,可以被定义如下:

其中

在通信系统之中,y是被收到的信号,而s则是要被重建的信号,一般来说会有以下两种情况:

1.,也就是说方程式的数量大于等于未知数的数量,这种情况发生的时候就可以利用最小平方法去求得最接近的解,求得的解如下:

其中伪逆矩阵

2.,也就是未知数的数量比方程式的数量来的多,这个方程组就被称为欠定线性系统,一般而言有无数个解,因此无法使用最小平方法去求得要重建的信号。

但是,如果这个欠定线性系统只有唯一一个稀疏解,那么我们可以利用压缩感知理论和方法来寻找这个解。值得注意的是,并不是所有欠定线性方程组都具有稀疏解。

举例来说,是一个欠定线性系统,会有无限多个解可以满足这个方程式,然而若加入稀疏的限制条件:之间只有一个有值,其余都是0;就可以很轻易地得到这个欠定线性系统的解为,这个就是压缩感知的最主要的精神所在。

从下图可以轻易地了解,当解具有稀疏的特性时,就可以从欠定线性系统有无限多组解的情况变成可以利用最小平方法找出解的情况。

稀疏性

[编辑]

一个向量的稀疏性可以被定义如下:

的个数。

也就是计算一个向量之中非零的个数,举例来说,如果,因此目标的解就会变成如下:

希望能在非零个数越少的情况之下,找到最有可能的解。然而在实际中,最优化L0范数是一个NP难的问题,需要穷举s中非零值的所有排列可能,因而无法求解。通常采取的手段是对L1范数进行最优化求解,优化目标则变为:

或是使用匹配追踪系列算法、迭代阈值法以及专门处理二维图像问题的最小全变分法等求得次最优解的算法进行计算。

有限等距性质(Restricted Isometry Property, RIP)

[编辑]

有限等距性质(RIP)是压缩还原算法中常常可以看见的名词,主要可以被用来分析还原算法的表现好坏。其定义如下:

其中的代表传感矩阵,代表的是信号能量,可以表示如下:

因此整个式子可以视为信号跟传感矩阵的相似程度,也就是做完转换后的能量,要被RIP限制住,而RIP要求

取样方法

[编辑]

在理论上,为了确保信号重建的准确度,需要令所采用的取样矩阵各行列之间相干性(coherence)尽量地低,且须矩阵元素(element)取值随机性尽量地高。

相干性(coherence)可以简单定义如下:

也就是取样矩阵任两个相异的行做内积后,取绝对值所产生的最大值,可以用来衡量信号重建的准确度。

而目前对于采样矩阵有下列几种选择可以使还原重建度有一定质量:

  1. 对n个A的行向量在m维的单位半径球面上进行随机采样
  2. 对任一个都采用相同独立的高斯分布N(0,)进行随机采样
  3. 对任一个都采用如下式相同独立的分布进行随机采样

除了上述的可能,现在也已经证实任何一个sub-gaussian的分布,都可以成为一个很好的测量矩阵,也就是说具有很好的还原效果。

而上述矩阵之所以常被拿来使用,主要是因为皆已经被验证具有高几率性满足有限等距性质,也就是相干性非常低,因此使用此方式进行信号取样后,仍可确保在信号具有足够稀疏性的前提下得到较佳的压缩感知重建效果。

且当使用上述矩阵时,只要信号x的非零数目成下列关系,可以确保信号被完美还原。

而C是一个根据不同情况而改变的常量。

但是在上述矩阵时,所需要的数据存储量过于庞大——每个矩阵元素都要单独记录,且数据类型一般为浮点数——这就促进了简化取样矩阵的研究;目前被提出的简化取样矩阵主要包括两种:结构简化采样矩阵与数值简化采样矩阵。

结构简化采样矩阵

[编辑]

目前较常被使用的两种结构简化采样矩阵为循环矩阵常对角矩阵

循环矩阵的形式为下式:

常对角矩阵的形式为下式:

其中

可以发现到,若采用循环矩阵作为测量矩阵的话,只需要访问一列的矩阵元素;相反地,若使用常对角矩阵,除了第一列的矩阵元素外,需要额外存储第一行的矩阵元素。

但是经过实验发现,常对角矩阵的相干性是低于循环矩阵的,因此用户可以依据自己的使用环境,来找到一个平衡点。

采用这两种矩阵进行压缩感知取样时,可以大幅降低存储成本,也为此算法的前端传感器大幅降低实现门槛。

数值简化采样矩阵

[编辑]

数值简化采样矩阵普遍将原有的、按照高斯分布随机取值的采样矩阵元素以数值上更为简单的元素取代,但在分布上维持矩阵元素的分布随机性——即缩减了储存浮点数这一方面的成本。

一种较为基本的数值简化采样矩阵是0-1伯努利矩阵,其中的元素仅有0和1两种,分布模式为相同独立的伯努利分布(identical independent Bernoulli distribution)。

对于每一个矩阵元素,该分布的概率质量函数为:

求解/重构方法

[编辑]

压缩感知利用了很多信号中所存在的冗余(换言之,这些信号并非完全是噪声)。具体而言,很多信号都是“稀疏”的;在适当的表示域中,它们的很多系数都是等于或约等于零。

在信号获取阶段,压缩感知在信号并不稀疏的域对信号进行线性测量。

为了从线性测量中重构出原来的信号,压缩感知求解一个称为L1-范数正则化的最小二乘问题。从理论上可以证明,在某些条件下,这个正则化最小二乘问题的解正是原欠定线性系统的稀疏解。

基追踪

[编辑]

基追踪英语basis pursuit是一种信号重建算法,被广泛地用于压缩感知领域,属于数学最优化问题的范畴,形式为

其中s是n×1向量,表示输出(信号),y是m×1的测量向量,Hm×n的“转换矩阵”或称作“测量矩阵”,其中M < N

基追踪常在需要完美满足欠定线性方程组系统中时被应用,且要求解在L1基准下为最稀疏的。

若应用情景允许降低对完美恢复的要求,以换取更加稀疏的解s降噪基追踪英语basis pursuit denoising更为适用。

匹配追踪

[编辑]

匹配追踪英语Matching pursuit是一种稀疏近似运算,旨在找到多维数据在某个超完备字典(dictionary)上映射的“最佳匹配”。其基本的概念就是要用来自的函数组(称为基元,或atom)的加权和来表示希尔伯特空间上的信号

其中表示被选取基元的序数,是每个基元的加权常数。对于固定的字典,匹配追踪会先找到与信号间内积最大的一个基元,再减去该基元带来的影响,然后重复找寻影响力次大的基元直到信号被较好地分解。

相较而言,以傅里叶级数表示的信号来说,字典是构建于正弦基函数之上的。信号处理领域中傅里叶分析的主要缺点就在于它只能提取出信号中常存的特征,而不能适应当前的分析目标信号

若采用一组极端保险、带有大量冗余的字典,我们就能够找到可以完美匹配信号的函数组。在对信号进行编码与压缩时,最好是能够找到一组映射,使加权和中的大部分系数都接近零(具有“稀疏性”)。

正交匹配追踪

[编辑]

正交匹配追踪(Orthogonal Matching Pursuit)是匹配追踪的特殊形式,正交匹配追踪的算法与匹配追踪相同,但是正交匹配追踪不会重复使用同一个基元来进行匹配,因此会比匹配追踪更快收敛。

迭代阈值算法

[编辑]

迭代阈值算法(Iterative Shrinkage-Thresholding Algorithm)是上述基于贪心算法(Greedy Algorithm)之匹配追踪与正交匹配追踪的替代算法,迭代算法主要是透过不断的投影和取阈值来进行收敛,而他在每次迭代中,都还可以进行其他优化例如:Wigener 滤波,不仅可以降低运算复杂度,也可以提高还原质量。

正交匹配追踪(Orthogonal Matching Pursuit)

[编辑]

正交匹配追踪是一个用来解决压缩感知问题的算法,在一定的复杂度之下有不错的表现,他背后最主要的想法是源自于贪心算法(Greedy Algorithm),以下将逐步解说。

首先这个问题被定义为:y=Ax,目标是要借由已知的y向量、A矩阵,来还原x向量,他会利用迭代的方式,逐步找出x向量当中最有可能是非零的位置。

一开始会有一个空集合,以及剩余的部分,每次迭代都会从找出一个A矩阵投影到剩余有最大值的位置,把这个位置加到之中,并从当中移除,最后再更新剩余。利用迭代的方式,不断地找出x向量当中最有可能非零的位置,直到达到算法停止条件。

在正交匹配追踪算法的基础上,Needell等人提出了正则正交匹配追踪(Regularized Orthogonal Matching Pursuit,ROMP)算法对于所有满足约束等距性条件的矩阵和所有稀疏信号进行重构。之后,引入回溯思想的压缩采样匹配追踪(Compressive Sampling Matching Pursuit,CoSaMP)算法被提出。

在实际应用中,稀疏信号非零元素个数K往往是未知的,而上述的匹配追踪算法都是建立在稀疏度K已知的基础上,因此出现了对K自适应的稀疏自适应匹配追踪(Sparsity Adaptive Matching Pursuit,SAMP)算法,它通过固定步长来逐步逼近进行重建,可以在稀疏度K未知的情况下获得较好的重建效果。

迭代阈值算法(Iterative Shrinkage-Thresholding Algorithm)

[编辑]

迭代阈值算法是从Relaxation Method启发而来,Relaxation Method是用于解决具有稀疏性的线性系统。

在迭代阈值算法中,问题一样是被定义为:

而在此算法中,每一次的迭代主要分成两部分:1、查找新的解。2、更新残值。 第一阶段,主要是利用投影的方式找到更新的向量方向,再透过取阈值的方式来进行优化。

是relaxation parameter,且

就是阈值函数(thresholding function),主要就是为了使迭代的过程中,逐渐逼近具有稀疏性性质的解,而目前主要有两大类取阈值的方式:硬阈值函数(Hard Thresholding Function)与软阈值函数(Soft Thresholding Function)。

硬阈值函数就是将小于阈值(thr)的解,一律通通过滤成0。

而软阈值函数则是使用较为平滑的方式,将值逼近于稀疏性的解

,而指示函数

而第二阶段,则是利用新算出来的来进行残差更新。

之后一直等到规定的循环数抵达即完成还原。

而此算法是Landweber iteration的变形,若没有加入阈值函数的话,就会收敛到

稀疏性空间投影

[编辑]

压缩感知还原算法包括整个压缩感知都是建立在信号有稀疏性上,但是并不是所有的信号都天然具有稀疏性,例:声音。那么是否不具有稀疏性的信号就不能使用压缩感知呢?答案为并不是,天然不具有稀疏性的信号还是能够使用压缩感知,只需要把该信号投影到其他空间,其他该信号有稀疏性的空间下,压缩感知就可直接使用在该投影空间上。可以被定义如下:

s:要被重建的信号(原信号);ψ:投影矩阵,把非稀疏性信号投影到稀疏性空间;z:非零项远小于零项

故原压缩感知公式定义也随之改变:

所以可以把视为原本压缩感知公式里面的H,还原算法即可一样使用。

至于的选择对于不同信号来说有很多种,有离散余弦变换(DCT) ,离散小波变换(DWT),字典学习(Dictionary Learning)等。

离散余弦变换和离散小波变换

[编辑]

利用信号经过这两种变换后都会有稀疏性的特性,把这两种变换变成矩阵形式,让信号直接投影到具有稀疏性的空间上。

好处

  1. 不需要特别针对信号做不同的选择,对于绝大部分信号可以直接使用。
  2. 并不需要前处理,可以直接使用。

坏处

  1. 限制了原信号的维度,必须满足n = ,x为任意正整数。
  2. 因为通用所有信号,故经过压缩感知还原算法后还原的信号质量较差。

字典学习

[编辑]

顾名思义即把当作一本要学习的字典,不断的利用该信号和还原算法后的结果做字典的更新,直到找到一个能够把该信号投影到稀疏性空间上。

字典学习的流程:

  1. 设置字典学习的学习次数(Iter)
  2. 收集一定量(L笔)要学习的资料s,组成S = [s1, s2, ... ,sL]
  3. 固定,利用还原算法找出每一笔资料的z,组成Z = [z1, z2, ... ,zL]
    • ||S - Z| s.t. ||zi||0 < Kth i
  4. 固定Z, 利用3.所得之Z来更新字典
    • 当Z固定时,定义误差ei = si - zi,组成E = [e1, e2, ... ,eL]
    • 所以整体的均方误差为 ||E|= || [e1, e2, ... ,eL] | = || S - Z|
    • Z固定下使得E最小,将得到关系式 (S - Z)ZT = 0
    • => = SZT(ZZT)-1
  5. 检查Z上面是否已经有稀疏性,如有则结束学习;如没有则回到3.直到达到学习的次数

字典学习的算法有很多,较为常用的有Method of optimal directions(MOD[1])。

好处

  1. 因为针对该种类信号做学习,故还原后的质量较好。
  2. 对原信号的维度并没有任何限制。

坏处

  1. 需要事前收集该种类的信号做学习,不能未学习直接使用。
  2. 因为针对该种类信号做学习,故直接使用在不同种类信号效果较差/不适用。

相关应用

[编辑]

压缩感知与包括欠定系统群验稀疏编码复用稀疏采样等。在成像科技领域,亦有许多技术如(编码孔计算摄影学)与压缩感知相关。亦有许多在不同技术完成度下将压缩感知实现的案例。

摄影学

[编辑]

压缩感知技术被用于手机摄像头传感器设计中。这一技术使得在获取图像时所耗费的能量大大降低,可达原先耗费的15分之一——当然,需要引入复杂的解压算法;这一运算可能会需要脱机状态下的预先安装、设置。

压缩感知亦被用于实现单像素摄影。贝尔实验室运用了这一技术,用无镜片单像素相机在栅格中随机选取的孔隙处拍照,以达到成像效果。随着拍照次数的逐渐增多,照片质量也会逐步提高;一般来说,这种技术较之传统的摄影成像技术仅仅需要一小部分的数据占用量,且能完全避免与镜片或聚焦相关的故障或失常;参见[1]页面存档备份,存于互联网档案馆) 。

全息成像

[编辑]

压缩感知可被用于增加通过单幅全息图中所能得到的立体像素的数量改进全息摄影技术中的图像重建问题。在光学全息图或毫米波全息图采样率不足的情况下,这一技术也能够被用于图像检索以作出改善。

面部识别

[编辑]

压缩感知目前被用于面部识别应用之中,参见Engineers Test Highly Accurate Face Recognition页面存档备份,存于互联网档案馆)。

核磁共振成像

[编辑]

压缩感知也被应用在医疗影像上,特别是核磁共振成像(Magnetic Resonance Imaging, MRI),具有稀疏的特性,因此能使用压缩感知的技术。在过去核磁共振成像会因为物理学、生理学上的限制,而有扫描时间较长的问题,如今压缩感知利用核磁共振成像具有的稀疏特性,来改善成像质量以及降低所需要量测数量,能有效缩短核磁共振的扫描时间,近期相关的压缩感知算法也被广为讨论,可以参见[2]页面存档备份,存于互联网档案馆) 、[3]页面存档备份,存于互联网档案馆) 与[4]页面存档备份,存于互联网档案馆),其中涉及的重建方法包括ISTA、FISTA、SISTA等。

地震成像

[编辑]

一般来说地震成像既不稀疏,也不可压缩,具有高维度、大面积的特性,因此会耗费大量的量测以及运算时间,所以希望能降低取样的次数,同时能保有原本的质量。因此有人利用压缩感知技术将取样以及编码同时进行,来达到降低维度的目的,最后再透过压缩感知的还原算法进行还原,可以参考[2]

模拟信息转换(Analog-to-Information Converter, AIC)

[编辑]

在通信系统当中会遇到高带宽的问题,因此会需要较高的采样率,然而其中的信号可能含有的信息是远小于带宽的,因此就会浪费软、硬件的资源来进行取样。所以有人提出用模拟信息转换(Analog-to-Information Converter, AIC)取代模拟数字转换(Analog-to-Digital Converter, ADC),利用随机解调(Random Demodulation)的方式,来降低所需要的取样次数,对于在时频上有稀疏特性、宽带的信号特别适合,可以参考[3]

网络诊断

[编辑]

压缩感知在被用于旨在利于网络管理网络诊断应用中时带来了极佳成效。对网络延时的估计和网络拥塞的探知均可被归纳、建模为非定性的线性方程组系统,其中的参数矩阵正是所分析网络的路由选择矩阵。此外,在互联网情景中,网络路由矩阵常常能够满足压缩感知技术所要求的几个基本要素:低相关性、稀疏性及(可能的)R.I.P条件,请参见[5]页面存档备份,存于互联网档案馆) 。

短红外摄影

[编辑]

目前,基于压缩感知技术的商用短红外相机已被推出[6]页面存档备份,存于互联网档案馆) 。这些相机的光敏度大约从0.9µm到1.7µm,在上述波段上,人类的肉眼是无效的。

通信通道估测

[编辑]

随着通信要求的带宽越来越大,因此可用的频带从微波(Microwave)转到毫米波(mmWave)的频段,虽然可用的带宽增加,然而会受到更严重的通道衰减,所以波束成型的技术被提出,结合天线数组来对抗通道衰减的效应。然而大量的天线数组会使得做通道估测的复杂度上升,传统的做法是使用最小平方法(Least Square, LS)来进行通道估测,不过有人发现通道具有稀疏的特性,因此提出了利用压缩感知的技术,进行压缩通道估测(Compressed Channel Estimation, CCS),相较最小平方法,不仅复杂度降低,还能达到更低的错误率以及延迟性。

信号源定位

[编辑]

利用压缩感知理论可以恢复出稀疏信号的特性,压缩感知理论被广泛应用于波达方向估计(Direction of Arrival,DOA)中。基于压缩感知的波达方向估计中将信号源矩阵看作是一个稀疏矩阵,在已知采样矩阵和阵列流形矩阵为前提下,对稀疏信号源矩阵进行重构以获得被测量信号源的波达方向。使用这种方法,不仅避免了传统波达方向估计中需要计算复杂协方差矩阵的步骤,同时还对空间中的相干信号源有着很好的性能。

物联网

[编辑]

物联网的情境之下,设备的数量会大幅增加,然而因为资源有限,所以用来辨别设备的展频码(m)会少于设备的数量(n),因此会使得整个系统变成欠定的线性系统,然而这些设备大部分的时候都是处于休息、监测的状态,并不会一直发送消息给基地台,因此就有了稀疏的性质,利用压缩感知的技术就能分辨出处于活动状态的设备,并解出其所发送的信号。

加密

[编辑]

压缩感知算法天生就具有加密的性质,因为要重建原本信号的话,必须要知道采样矩阵才能进重建。因此现今也有许多加密的研究关注于压缩感知算法,因为虚拟随机数传感矩阵(Pseudo-random Sensing Matrix)可以被视为一组加密后的钥匙,能对信号进行压缩并同时加密,而不需要额外的运算,可以参考[4]

参考资料

[编辑]
  • Candès, E.J., & Wakin, M.B., An Introduction To Compressive Sampling, IEEE Signal Processing Magazine, V.21, March 2008
  • J. Choi et al., "Compressive Sensing for Wireless Communications: Useful Tips and Tricks", IEEE Commun. Survey and Tutorials.
  • C. Bockelmann, H. F. Schepker, and A. Dekorsy, "Compressive sensing based multi‐user detection for machine‐to‐machine communication," Transactions on Emerging Telecommunications Technologies, vol. 24, no. 4, pp. 389-400, 2013.
  • F. Monsees, C. Bockelmann, D. Wubben, and A. Dekorsy, "Sparsity aware multiuser detection for machine to machine communication," 2012 IEEE Globecom Workshops, Anaheim, CA, 2012, pp. 3-7.
  • Shen Q, Liu W, Cui W, et al. "Underdetermined DOA Estimation Under the Compressive Sensing Framework: A Review". IEEE Access, 2016: 8865-8878.
  • Jian-Jiun Ding, “Time Frequency Analysis and Wavelet Transforms ”, NTU, 2021.

外部链接

[编辑]
  1. ^ Engan, K.; Aase, S.O.; Hakon Husoy, J. Method of optimal directions for frame design. 1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings. ICASSP99 (Cat. No.99CH36258) (IEEE). 1999. ISBN 0780350413. doi:10.1109/icassp.1999.760624. 
  2. ^ Hennenfent, Gilles; Herrmann, Felix J. Simply denoise: Wavefield reconstruction via jittered undersampling. GEOPHYSICS: V19–V28. [2017-12-16]. doi:10.1190/1.2841038. (原始内容存档于2018-06-09). 
  3. ^ Laska, J. N.; Kirolos, S.; Duarte, M. F.; Ragheb, T. S.; Baraniuk, R. G.; Massoud, Y. Theory and Implementation of an Analog-to-Information Converter using Random Demodulation. 2007 IEEE International Symposium on Circuits and Systems. May 2007: 1959–1962. doi:10.1109/ISCAS.2007.378360. 
  4. ^ Orsdemir, A.; Altun, H. O.; Sharma, G.; Bocko, M. F. On the security and robustness of encryption via compressed sensing. MILCOM 2008 - 2008 IEEE Military Communications Conference. November 2008: 1–7 [2017-12-16]. doi:10.1109/MILCOM.2008.4753187. (原始内容存档于2021-02-24).