分散

分散の最新ニュースをまとめて検索!

曖昧さ回避 この項目では、数学、特に確率・統計における分散について記述しています。光学における分散については「分散 (光学)」を、コロイドなど微粒子が媒質に懸濁している状態については「分散系」をご覧ください。

分散(ぶんさん、variance)は、確率論において、確率変数の2次の中心化モーメントのことで、確率変数の分布期待値からどれだけばらけているかを示す値。統計学においては、確率変数の分散だけでなく、標本標本平均からどれだけばらけているかを示す指標として標本分散が用いられる。

目次

[編集] 確率変数の分散

2乗可積分確率変数Xの分散は、E期待値を表すことにして

V(X)=E((X-E(X))^2)\,

で定義される。同値な表現として、

V(X)=E(X^2)-(E(X))^2\,

とも書ける。

チェビシェフの不等式から、任意の正数εに対して

P(|X-E(X)|>\varepsilon)\leq\frac{V(X)}{\varepsilon^2}

が成り立つが、これは分散が小さくなるほど期待値の近くに変数が分布していることを示すおおざっぱな評価である。

確率変数XY独立の場合、V(X + Y) = V(X) + V(Y)となる。

独立でない場合、Cov共分散を表すことにして、V(X + Y) = V(X) + V(Y) + 2Cov(X,Y)となる。

[編集] 標本分散

n 個のデータ x1, x2, …, xn からなる標本があって、x をそのデータの相加平均とした時に、(x - xi)2 の平均

s^2=\frac{1}{n}\sum_{i=1}^{n}(\bar{x}-x_i)^2

標本分散 (sample variance) という。なお、後述の不偏分散を標本分散と呼ぶ文献もある。

定義より

s^2=\frac{1}{n}\sum_{i=1}^{n}x_i^2-(\bar{x})^2=\bar{x^2}-(\bar{x})^2

となるから、標本分散は、理論的には2乗の平均から平均の2乗を引いた値に等しい。したがって、手計算などではこの式による分散の計算が簡便でよい。しかし、有限桁しか扱えないコンピュータでこの式による標本分散を計算すると、桁落ちによる誤差が発生して正しく計算できないおそれがあるので、定義の式で計算することが望ましい。

[編集] 不偏分散

標本分散は、その期待値が母分散(母集団の分散)よりも若干小さくなることが知られている。そこで、期待値が母分散に等しくなるように補正をかけた

u^2=\frac{1}{n-1}\sum_{i=1}^{n}(\bar{x}-x_i)^2

が用いられることも多く、これを母分散の不偏推定量であるとの意味で不偏分散 (unbiased variance) と呼ぶ。定義式より明らかなように、標本数が十分多ければ、不偏分散と標本分散の値はほぼ等しい。

[編集] 不偏分散の期待値

不偏分散 u2 の期待値が母分散 σ2 に等しいことを示す。以下、母平均を μ とし、Σ は i = 1 から n までの和を表すものとする。また、関係式

V[X]=E[X^2]-E[X]^2,\,
E[x_i]=\mu , \, V[x_i]=\sigma^2

は繰り返し用いる。


\begin{align}
E[u^2]&=E\left[ \frac{1}{n-1}\sum_{i} (x_i-\bar{x})^2 \right] \\
&=\frac{1}{n-1}\sum_{i}\left( E[x_i^2] -2 E[x_i\bar{x}] + E[\bar{x}^2] \right) \\ 
&=\frac{1}{n-1}\sum_{i}\left( \left(V \left[x_i \right]+E \left[x_i\right]^2 \right) -2 E[\bar{x}^2] + E[\bar{x}^2] \right) \\ 
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)- E[\bar{x}^2] \right) \\
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(V\left[\frac{1}{n}\sum_{i} x_i\right]+\mu^2 \right )\right) \\
&=\frac{n}{n-1}\left( (\sigma^2+\mu^2)-\left(\frac{1}{n^2}\sum_{i} V\left[x_i\right]+\mu^2 \right )\right) \\
&=\frac{n}{n-1}\left( \sigma^2-\frac{1}{n^2} \cdot n\sigma^2 \right) \\
&=\sigma^2
\end{align}

[編集] 関連項目

最終更新 2009年11月7日 (土) 16:49 (日時は個人設定で未設定ならばUTC)。
【分散】変更履歴

ご利用上の注意

もっと調べる!