统计量

X1X_1X2X_2,...,XnX_n是来自总体XX(随机变量)的一个样本,它们相互独立,g(X1,X2,...,Xn)g(X_1,X_2,...,X_n)X1X_1X2X_2,...,XnX_n的函数,若gg中不含未知参数,则称g(X1,X2,...,Xn)g(X_1,X_2,...,X_n)是一统计量

因为X1X_1X2X_2,...,XnX_n都是随机变量,而统计量是随机变量的函数,因此统计量是一个随机变量。设x1,x2,...,xnx_1,x_2,...,x_n是相应于样本X1X_1X2X_2,...,XnX_n的样本值,则称g(x1,x2,...,x3)g(x_1,x_2,...,x_3)g(X1,X2,...,Xn)g(X_1,X_2,...,X_n)观察值

样本均值

X=1ni=1nXi \overline{X}=\frac{1}{n}\displaystyle\sum_{i=1}^{n} X_i

样本方差(无偏估计)

S2=1n1i=1n(XiX)2=1n1(i=1nXi2nX2) S^2=\frac{1}{n-1}\displaystyle\sum_{i=1}^{n} (X_i-\overline{X})^2=\frac{1}{n-1}(\displaystyle\sum_{i=1}^{n} X_i^2-n\overline{X}^2)

样本标准差

S=S2=1n1i=1n(XiX)2 S=\sqrt{S^2}=\sqrt{\frac{1}{n-1}\displaystyle\sum_{i=1}^{n} (X_i-\overline{X})^2}

样本kk阶(原点)距

Ak=1ni=1nXik A_k=\frac{1}{n}\displaystyle\sum_{i=1}^{n} X_i^k

样本kk阶中心距

Ak=1ni=1n(XiX)k A_k=\frac{1}{n}\displaystyle\sum_{i=1}^{n} (X_i-\overline{X})^k

样本的协方差:

Cov(X,Y)=1n1i=1n(XiX)(YiY) Cov(X,Y)=\frac{1}{n-1}\displaystyle\sum_{i=1}^{n} (X_i-\overline{X})(Y_i-\overline{Y})

其中X1X_1X2X_2,...,XnX_n是来自总体XX的一个样本,Y1Y_1Y2Y_2,...,YnY_n是来自总体YY的一个样本。

样本协方差矩阵:

假定X1X_1X2X_2,...,XnX_n是多维随机变量

cij=Cov(Xi,Xj)=1n1k=1n(XikXi)(XjkXj) c_{ij}=Cov(X_{i},X_{j})=\frac{1}{n-1}\displaystyle\sum_{k=1}^{n} (X_{ik}-\overline{X_i})(X_{jk}-\overline{X_j})

C=[c11c12...c1nc21c22...c2ncn1cn2...cnn] C=\begin{bmatrix} c_{11} & c_{12} & ... & c_{1n} \\ c_{21} & c_{22} & ... & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & ... & c_{nn} \end{bmatrix}

为什么样本方差是除以n1n-1,而不是nn

“均值已经用了nn个数的平均来做估计,在求方差时,只有n1n-1个数和均值信息是不相关的。而第nn个数已经可以由前n1n-1个数和均值来唯一确定,实际上没有信息量,所以在计算方差时,只除以n1n-1

(详细请参考 https://www.zhihu.com/question/20099757)

results matching ""

    No results matching ""