2.4 平行因子理论
2.4.1 平行因子模型
三线性分解又称规范分解、三倍数积分解或平行因子(Parallel Factor,PARAFAC)分析。I×J×K的三维阵列(其元素为)及F元的三线性分解[2]:
其中,i=1,2,…I; j=1,2,…,J; k=1,2,…,K。定义下列矩阵:I×F维矩阵A,其元素为;J×F维矩阵B,其元素为;K×F维矩阵C,其元素为。则式(2-81)中的模型可以写成沿三个不同维度的联立方程,每个方程都可以解释成沿三个不同维度去“切”三维阵列X的结果,如下:
其中Di(A)为由矩阵A的第i行元素构成的对角矩阵。
PARAFAC是一个三维模型,属于多维阵列的代数,也称多维分析。PARAFAC可以看成三维阵列的低秩分解,就像奇异值分解可以看成矩阵的低秩分解一样。但是,从矩阵(二维阵列)到三维阵列,其中有很大的不同,即低秩矩阵分解不是唯一的(奇异值分解之所以是唯一的,是因为施加了正交性约束),但在适当的假设条件下,PARAFAC是唯一的,不需要正交性或其他的约束条件。
2.4.2 可辨识性
与矩阵秩的概念一样,k-秩(Kruskal-秩)的概念在多线性代数里起着非常重要的作用[2]。
定义2.4.1 对于给定的矩阵,当且仅当A包含至少r+1个独立的列时,A的秩为。如果矩阵A的任意k列独立,则A的k-秩。此时,k=F,或者A包含k+1个独立的列,即
性质2.4.1 一个随机矩阵,其列是从绝对连续分布中独立提出的,则它以概率1具有满秩,并具有满k-秩,即
性质2.4.2 Vandermonde矩阵的k-秩。一个由非零序列构成的Vand-ermonde矩阵,不仅具有满秩,而且具有满k-秩。
性质2.4.3 Khatri-Rao乘积的k-秩。考虑Khatri-Rao(列Kronecker)乘积
其中,A的大小为I×F,B的大小为J×F。如果A和B均不含有全零列(因此,),则
三线性模型的本质特征就是其唯一性。在合适的条件下,三线性模型本质上是唯一的,即在没有阵模糊的情况下,A、B和C是可辨识的。下面介绍几个结论。
定理2.4.1 给定,,,如果
则A、B和C对于列交换和(复数)尺度变换是唯一的。
从绝对连续分布中取出的相对独立的列组成的矩阵以概率1具有满k-秩。如果三个矩阵都满足该条件,则可辨识的充分条件为
如果对A、B和C可以有其他的结构约束,则可望获得更佳的可辨识性结果,将A、B、C中的一个或几个限制为Vandermonde矩阵。
定理2.4.2 ,,,是由非零序列构成的Vandermonde矩阵。如果
则A、B和C是可辨识的(列的模交换和尺度变换)。
如果三个矩阵中有两个以上为Vandermonde矩阵,结果会进一步增强。
定理2.4.3 给定,,,设A和B是由非零序列构成的Vandermonde矩阵,如果
则A、B和C是可辨识的(列的模交换和尺度变换)。
如果三个矩阵全是Vandermonde矩阵,则可得到下述结论。
定理2.4.4 给定的,,,设A、B和C是由非零序列构成的Vandermonde矩阵。如果
I+J+K≥2F+2
则A、B和C是可辨识的(列的模交换和尺度变换)。
定理2.4.5 多线性分解的唯一性。考虑一个d-线性模型[2]:
其中,,设模型在不能用少于F个元表示的意义上是不可约的(等价地说,具有典型元素的d维阵列的秩为F)。给定,,,则对于列的模交换和尺度变换是唯一的,只要满足
2.4.3 PARAFAC分解
关于PARAFAC模型的求解前人已经研究出了不少算法,本书主要介绍较为常用的三线性交替最小二乘(Trilinear Alternating Least Square,TALS)算法。三线性交替最小二乘算法是三线性模型进行数据检测的一种常用方法。TALS的基本思想是每一步更新一个矩阵,更新的办法是:对余下的矩阵,依据前一次估计的结果,利用最小二乘(LS)来更新;继续对其他矩阵进行更新;重复以上步骤直到算法收敛[2]。具体如下:
(1)根据式(2-83),得到
其中,为含噪信号。的最小二乘估计为
(2)根据式(2-84),得到
其中,为含噪信号。的最小二乘估计为
(3)根据式(2-82),得到
其中,为含噪信号。的最小二乘估计为
(4)循环更新矩阵,直到收敛。