数学和多元变量统计中,中心化矩阵[1]指对称幂等矩阵,且当其与向量相乘时,效果等用于从向量的每个分量中减去分量的平均值。
大小为n的中心化矩阵是n×n的

其中
是单位矩阵,
是n×n一矩阵。例如
,
,
![{\displaystyle C_{3}=\left[{\begin{array}{rrr}1&0&0\\0&1&0\\0&0&1\end{array}}\right]-{\frac {1}{3}}\left[{\begin{array}{rrr}1&1&1\\1&1&1\\1&1&1\end{array}}\right]=\left[{\begin{array}{rrr}{\frac {2}{3}}&-{\frac {1}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&{\frac {2}{3}}&-{\frac {1}{3}}\\-{\frac {1}{3}}&-{\frac {1}{3}}&{\frac {2}{3}}\end{array}}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a280df1cf0b14b46e0f24b487f0c0f0dc22269a3)
给定长为n的列向量
,
的中心性可表为

其中
是值全为1的列向量,
是
的分量的平均值。
是正半定对称阵。
是幂等矩阵,所以
。均值被移除的话它就是零,再次移除也没有任何影响。
是奇异矩阵/不可逆矩阵。应用
变换的效果无法逆转。
具有重数为n-1的特征值1与重数为1的特征值0
沿向量
有维度为1的零空间。
是正交投影矩阵。也就是说
是
在n-1维线性子空间上的投影,其与零空间
正交(这是所有分量和为0的n向量构成的子空间)。
的迹是
。
虽然与中心化矩阵相乘并不是去除向量均值的有效计算方法,但却是一种方便的分析工具。它不仅可用来去除单个向量的均值,还可去除存储在m×n矩阵
的行或列中多个向量的均值。
左乘
将从n列的每一列减去相应的均值,这样积
的每列的均值都是0。相似地,右乘
会从每行减去相应的均值,这样积
的每行均值都为0。两侧均乘:
将产生行列均值均为0的矩阵。
中心化矩阵提供了一种表示散布矩阵的方法:对数据样本
,有
,其中
是样本均值。有了中心化矩阵,可以将散布矩阵更简洁地表示为

是多项分布的协方差矩阵,在特殊情况下分布参数为
,
。
- ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.