特征函数 (概率论)

在概率论中，任何随机变量的特征函数（缩写：ch.f，复数形式：ch.f's）完全定义了它的概率分布。在实直线上，它由以下公式给出，其中 $X$ 是任何具有该分布的随机变量：

\varphi _{X}(t)=\operatorname {E} \left(e^{itX}\right)

，

其中 $t$ 是一个实数， $i$ 是虚数单位， $E$ 表示期望。

用矩母函数 $M_{X}(t)$ 来表示（如果它存在），特征函数就是 $iX$ 的矩母函数，或 $X$ 在虚数轴上求得的矩母函数。

\varphi _{X}(t)=M_{iX}(t)=M_{X}(it)

与矩母函数不同，特征函数总是存在。

如果 $F_{X}$ 是累积分布函数，那么特征函数由黎曼－斯蒂尔杰斯积分给出：

\operatorname {E} \left(e^{itX}\right)=\int _{-\infty }^{\infty }e^{itx}\,dF_{X}(x)

。

在概率密度函数 $f_{X}$ 存在的情况下，该公式就变为：

\operatorname {E} \left(e^{itX}\right)=\int _{-\infty }^{\infty }e^{itx}f_{X}(x)\,dx

。

如果 $X$ 是一个向量值随机变量，我们便取自变量 $t$ 为向量， $tX$ 为数量积。

$R$ 或 $R^{n}$ 上的每一个概率分布都有特征函数，因为我们是在有限测度的空间上对一个有界函数进行积分，且对于每一个特征函数都正好有一个概率分布。

一个对称概率密度函数的特征函数（也就是满足 $f_{X}(x)=f_{X}(-x)$ ）是实数，因为从 $x>0$ 所获得的虚数部分与从 $x<0$ 所获得的相互抵消。

性质

连续性

勒维连续定理说明，假设 $(X_{n})_{n=1}^{\infty }$ 为一个随机变量序列，其中每一个 $X_{n}$ 都有特征函数 $\varphi _{n}$ ，那么它依分布收敛于某个随机变量 $X$ ：

X_{n}{\xrightarrow {\mathcal {D}}}X

当

n\to \infty

如果

\varphi _{n}\quad {\xrightarrow {\textrm {pointwise}}}\quad \varphi

当

n\to \infty

且 $\varphi (t)$ 在 $\ t=0$ 处连续， $\varphi$ 是 $X$ 的特征函数。

勒维连续定理可以用来证明弱大数定律。

反演定理

在累积概率分布函数与特征函数之间存在双射。也就是说，两个不同的概率分布不能有相同的特征函数。

给定一个特征函数φ，可以用以下公式求得对应的累积概率分布函数 $F$ ：

F_{X}(y)-F_{X}(x)=\lim _{\tau \to +\infty }{\frac {1}{2\pi }}\int _{-\tau }^{+\tau }{\frac {e^{-itx}-e^{-ity}}{it}}\,\varphi _{X}(t)\,dt

。

一般地，这是一个广义积分；被积分的函数可能只是条件可积而不是勒贝格可积的，也就是说，它的绝对值的积分可能是无穷大。^[1]

博赫纳-辛钦定理/公理化定义

任意一个函数 $\varphi$ 是对应于某个概率律 $\mu$ 的特征函数，当且仅当满足以下三个条件：

$\varphi \,$ 是连续的；
$\varphi (0)=1\,$ ；
$\varphi \,$ 是一个正定函数（注意这是一个复杂的条件，与 $\varphi >0$ 不等价）。

计算性质

特征函数对于处理独立随机变量的函数特别有用。例如，如果 $X_{1}$ 、 $X_{2}$ 、……、 $X_{n}$ 是一个独立（不一定同分布）的随机变量的序列，且

S_{n}=\sum _{i=1}^{n}a_{i}X_{i},\,\!

其中 $a_{i}$ 是常数，那么 $S_{n}$ 的特征函数为：

\varphi _{S_{n}}(t)=\varphi _{X_{1}}(a_{1}t)\varphi _{X_{2}}(a_{2}t)\cdots \varphi _{X_{n}}(a_{n}t).\,\!

特别地， $\varphi _{X+Y}(t)=\varphi _{X}(t)\varphi _{Y}(t)$ 。这是因为：

\varphi _{X+Y}(t)=E\left(e^{it(X+Y)}\right)=E\left(e^{itX}e^{itY}\right)=E\left(e^{itX}\right)E\left(e^{itY}\right)=\varphi _{X}(t)\varphi _{Y}(t)

。

注意我们需要 $X$ 和 $Y$ 的独立性来确立第三和第四个表达式的相等性。

另外一个特殊情况，是 $a_{i}={\frac {1}{n}}$ 且 $S_{n}$ 为样本平均值。在这个情况下，用 ${\overline {X}}$ 表示平均值，我们便有：

\varphi _{\overline {X}}(t)=\left(\varphi _{X}\left({\frac {t}{n}}\right)\right)^{n}

。

特征函数举例

分布	特征函数 $\varphi (t)$
退化分布 $\delta _{a}$	$e^{ita}$
伯努利分布 $\mathrm {Bern} (p)$	$1-p+pe^{it}$
二项分布 $B(n,p)$	$(1-p+pe^{it})^{n}$
负二项分布 $NB(r,p)$	${\biggl (}{\frac {1-p}{1-pe^{i\,t}}}{\biggr )}^{\!r}$
泊松分布 $\mathrm {Pois} (\lambda )$	$e^{\lambda (e^{it}-1)}$
连续均匀分布 $U(a,b)$	${\frac {e^{itb}-e^{ita}}{it(b-a)}}$
拉普拉斯分布 $L(\mu ,b)$	${\frac {e^{it\mu }}{1+b^{2}t^{2}}}$
正态分布 $N(\mu ,\sigma ^{2})$	$e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}$
卡方分布 $\chi _{k}^{2}$ _k	$(1-2it)^{-{\frac {k}{2}}}$
柯西分布 $C(\mu ,\theta )$	$e^{it\mu -\theta \|t\|}$
伽玛分布 $\Gamma (k,\theta )$	$(1-it\theta )^{-k}$
指数分布 $\mathrm {Exp} (\lambda )$	$(1-it\lambda ^{-1})^{-1}$
多元正态分布 $N(\mu ,\Sigma )$	$e^{it^{T}\mu -{\frac {1}{2}}t^{T}\Sigma t}$
多元柯西分布 $\mathrm {MultiCauchy} (\mu ,\Sigma )$ ^[2]	$e^{it^{T}\mu -{\sqrt {t^{T}\Sigma t}}}$

Oberhettinger (1973) 提供的特征函数表.

特征函数的应用

由于连续定理，特征函数被用于中心极限定理的最常见的证明中。

矩

特征函数还可以用来求出某个随机变量的矩。只要第n个矩存在，特征函数就可以微分n次，得到：

\operatorname {E} \left(X^{n}\right)=i^{-n}\,\varphi _{X}^{(n)}(0)=i^{-n}\,\left[{\frac {d^{n}}{dt^{n}}}\varphi _{X}(t)\right]_{t=0}.\,\!

例如，假设 $X$ 具有标准柯西分布。那么 $\varphi _{X}(t)=e^{-|t|}$ 。它在 $t=0$ 处不可微，说明柯西分布没有期望。另外，注意到 $n$ 个独立的观测的样本平均值 ${\overline {X}}$ 具有特征函数 $\varphi _{\overline {X}}(t)=(e^{-{\frac {\left\vert t\right\vert }{n}}})^{n}=e^{-|t|}$ ，利用前一节的结果。这就是标准柯西分布的特征函数；因此，样本平均值与总体本身具有相同的分布。

特征函数的对数是一个累积量母函数，它对于求出累积量是十分有用的；注意有时定义累积量母函数为矩母函数的对数，而把特征函数的对数称为第二累积量母函数。

一个例子

具有尺度参数 $\theta$ 和形状参数k的伽玛分布的特征函数为：

(1-\theta \,i\,t)^{-k}

。

现在假设我们有：

\ X\sim \Gamma (k_{1},\theta )

且

\ Y\sim \Gamma (k_{2},\theta )

其中 $X$ 和 $Y$ 相互独立，我们想要知道 $X+Y$ 的分布是什么。 $X$ 和 $Y$ 特征函数分别为：

\varphi _{X}(t)=(1-\theta \,i\,t)^{-k_{1}},\,\qquad \varphi _{Y}(t)=(1-\theta \,i\,t)^{-k_{2}}

根据独立性和特征函数的基本性质，可得：

\varphi _{X+Y}(t)=\varphi _{X}(t)\varphi _{Y}(t)=(1-\theta \,i\,t)^{-k_{1}}(1-\theta \,i\,t)^{-k_{2}}=\left(1-\theta \,i\,t\right)^{-(k_{1}+k_{2})}

。

这就是尺度参数为 $\theta$ 、形状参数为 $k_{1}+k_{2}$ 的伽玛分布的特征函数，因此我们得出结论：

X+Y\sim \Gamma (k_{1}+k_{2},\theta )

，

这个结果可以推广到 $n$ 个独立、具有相同尺度参数的伽玛随机变量：

\forall i\in \{1,\ldots ,n\}:X_{i}\sim \Gamma (k_{i},\theta )\qquad \Rightarrow \qquad \sum _{i=1}^{n}X_{i}\sim \Gamma \left(\sum _{i=1}^{n}k_{i},\theta \right)

。

多元特征函数

如果 $X$ 是一个多元随机变量，那么它的特征函数定义为：

\varphi _{X}(t)=\operatorname {E} \left(e^{it\cdot X}\right)

。

这里的点表示向量的点积，而向量 $t$ 位于 $X$ 的对偶空间内。用更加常见的矩阵表示法，就是：

\varphi _{X}(t)=\operatorname {E} \left(e^{it^{T}X}\right)

。

例子

如果 $X\sim N(0,\Sigma )\,$ 是一个平均值为零的多元高斯随机变量，那么：

\varphi _{X}(t)=\operatorname {E} \left(e^{it^{T}X}\right)=\int _{x\in \mathbf {R} ^{n}}{\frac {1}{\left(2\pi \right)^{n/2}\left|\Sigma \right|^{1/2}}}\,e^{-{\frac {1}{2}}x^{T}\Sigma ^{-1}x}\cdot e^{it^{T}x}\,dx=e^{-{\frac {1}{2}}t^{T}\Sigma t},\quad t\in \mathbf {R} ^{n},

其中 $|\Sigma |$ 表示正定矩阵 Σ的行列式。

矩阵值随机变量

如果 $X$ 是一个矩阵值随机变量，那么它的特征函数为：

\varphi _{X}(T)=\operatorname {E} \left(e^{i\,\mathrm {Tr} (XT)}\right)

在这里， $\mathrm {Tr} (\cdot )$ 是迹函数， $\ XT$ 表示 $T$ 与 $X$ 的矩阵乘积。由于矩阵XT一定有迹，因此矩阵X必须与矩阵T的转置的大小相同；因此，如果X是m × n矩阵，那么T必须是n × m矩阵。

注意乘法的顺序不重要（ $XT\neq TX$ 但 $\ tr(XT)=tr(TX)$ ）。

矩阵值随机变量的例子包括威沙特分布和矩阵正态分布。

参考文献

^ P. Levy, Calcul des probabilités, Gauthier-Villars, Paris, 1925. p. 166
^ Kotz et al. p. 37 using 1 as the number of degree of freedom to recover the Cauchy distribution

Lukacs E. (1970) Characteristic Functions. Griffin, London. pp. 350
Bisgaard, T. M., Sasvári, Z. (2000) Characteristic Functions and Moment Sequences, Nova Science

[1] P. Levy, Calcul des probabilités, Gauthier-Villars, Paris, 1925. p. 166

[2] Kotz et al. p. 37 using 1 as the number of degree of freedom to recover the Cauchy distribution

[1]

[2]

查论编概率分布的理论
概率质量函数(pmf) 概率密度函数(pdf) 累积分布函数(cdf) 分位函数
矩中心矩期望方差标准差偏度峰度
矩生成函数(mgf) 特征函数概率生成函数(pgf) 累积量

性质

连续性