分散
分散の最新ニュースをまとめて検索!
分散(ぶんさん、variance)は、確率論において、確率変数の2次の中心化モーメントのことで、確率変数の分布が期待値からどれだけばらけているかを示す値。統計学においては、確率変数の分散だけでなく、標本が標本平均からどれだけばらけているかを示す指標として標本分散が用いられる。
目次 |
[編集] 確率変数の分散
2乗可積分確率変数Xの分散は、Eで期待値を表すことにして
で定義される。同値な表現として、
とも書ける。
チェビシェフの不等式から、任意の正数εに対して
が成り立つが、これは分散が小さくなるほど期待値の近くに変数が分布していることを示すおおざっぱな評価である。
確率変数XとYが独立の場合、V(X + Y) = V(X) + V(Y)となる。
独立でない場合、Covで共分散を表すことにして、V(X + Y) = V(X) + V(Y) + 2Cov(X,Y)となる。
[編集] 標本分散
n 個のデータ x1, x2, …, xn からなる標本があって、x をそのデータの相加平均とした時に、(x - xi)2 の平均
を標本分散 (sample variance) という。なお、後述の不偏分散を標本分散と呼ぶ文献もある。
定義より
となるから、標本分散は、理論的には2乗の平均から平均の2乗を引いた値に等しい。したがって、手計算などではこの式による分散の計算が簡便でよい。しかし、有限桁しか扱えないコンピュータでこの式による標本分散を計算すると、桁落ちによる誤差が発生して正しく計算できないおそれがあるので、定義の式で計算することが望ましい。
[編集] 不偏分散
標本分散は、その期待値が母分散(母集団の分散)よりも若干小さくなることが知られている。そこで、期待値が母分散に等しくなるように補正をかけた
が用いられることも多く、これを母分散の不偏推定量であるとの意味で不偏分散 (unbiased variance) と呼ぶ。定義式より明らかなように、標本数が十分多ければ、不偏分散と標本分散の値はほぼ等しい。
[編集] 不偏分散の期待値
不偏分散 u2 の期待値が母分散 σ2 に等しいことを示す。以下、母平均を μ とし、Σ は i = 1 から n までの和を表すものとする。また、関係式
は繰り返し用いる。







![V[X]=E[X^2]-E[X]^2,\,](/ja/math/6/e/1/6e1e683d06ede7f15c7aa428047c7c1b.png)
![E[x_i]=\mu , \, V[x_i]=\sigma^2](/ja/math/b/5/6/b569abf061c34def162dcc0f13e1b5d9.png)
![\begin{align}
E[u^2]&=E\left[ \frac{1}{n-1}\sum_{i} (x_i-\bar{x})^2 \right] \\
&=\frac{1}{n-1}\sum_{i}\left( E[x_i^2] -2 E[x_i\bar{x}] + E[\bar{x}^2] \right) \\
&=\frac{1}{n-1}\sum_{i}\left( \left(V \left[x_i \right]+E \left[x_i\right]^2 \right) -2 E[\bar{x}^2] + E[\bar{x}^2] \right) \\
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)- E[\bar{x}^2] \right) \\
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(V\left[\frac{1}{n}\sum_{i} x_i\right]+\mu^2 \right )\right) \\
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(\frac{1}{n^2}\sum_{i} V\left[x_i\right]+\mu^2 \right )\right) \\
&=\frac{n}{n-1}\left( \sigma^2-\frac{1}{n^2} \cdot n\sigma^2 \right) \\
&=\sigma^2
\end{align}](/ja/math/d/9/b/d9bb2409dea1d7753b7831e375c8c32f.png)
