日大工 総合教育 樋口幸治郎
ホーム | 教室 | 研究室 |
---|---|---|
統計学 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
正規分布(教科書p143-151,p264).
定義 連続型確率変数$X$の確率密度$f(x)$が $$f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)\qquad(\mu, \sigmaは定数, \sigma>0, -\infty<x<\infty)$$ で与えられるとする. この確率分布を正規分布$N(\mu,\sigma^2)$(またはガウス分布)といい, $X$は$N(\mu,\sigma^2)$に従うという. $N(0,1)$を標準正規分布という.
定理 確率変数$X$が$N(\mu,\sigma^2)$に従うとき, 確率変数$Z$を $$Z=\dfrac{X-\mu}{\sigma}\tag{1}$$ と置く. このとき, $Z$は$N(0,1)$に従い, $$P(a\le X\le b)=P\left(\dfrac{a-\mu}{\sigma}\le Z\le \dfrac{b-\mu}{\sigma}\right)$$ $$P(\mu+a\sigma\le X\le \mu+b\sigma)=P(a\le Z\le b)$$ が成り立つ.
証明 後半の等式は明らかであるから, $Z$が$N(0,1)$に従うことだけ示す. $X$の確率密度$f(x)$は $$f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)$$ であるから, 確率$P(a\le Z\le b)$は $$\begin{align} &P(a\le Z\le b) =P(\mu+a\sigma\le Z\le \mu+b\sigma) =\int^{\mu+b\sigma}_{\mu+a\sigma}\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)dx\\ \underset{変数変換x=\mu+\sigma z}{=}&\int^{b}_{a}\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{z^2}{2}\right)\cdot\dfrac{dx}{dz} dz =\int^{b}_{a}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz \end{align}$$ であるから, 確率変数$Z$の確率密度は $$\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)$$ である. これは$Z$が標準正規分布$N(0,1)$に従うことを意味する.
上記の定理は, 正規分布の確率の計算は標準正規分布の確率の計算に帰着することを意味している. 標準正規分布の確率の値の近似値は, 標準正規分布表で与えられている. また, 証明の中で行ったように $$x=\mu+\sigma z$$ による積分の変数変換は, 正規分布の分析に非常に役立つ.
定義 確率変数$Z$は標準正規分布$N(0,1)$に従うとする. 与えられた実数$\alpha$ ($0\le \alpha\le 1$)に対し, $$P(Z> z)=\alpha$$ となる実数$z$を $$z(\alpha)$$ で表し, これを上側$\alpha$点という. 同様に下側$\alpha$点も定義できるが, この値は$z(1-\alpha)$となる.
定理 $$\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)dx=1$$ が成り立つ. つまり, 正規分布の確率分布$f(x)$は, 確かに, 確率分布の定義の条件を満たす.
証明(スケッチ) 変数変換$x=\mu+\sigma z$を行えば, $$\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)dx =\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz$$ であるから, 右辺の値 $$a=\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{x^2}{2}\right)dx$$が$1$であることを示そう. $$\begin{align} &a^2 =\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{x^2}{2}\right)dx \int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{y^2}{2}\right)dy =\dfrac{1}{2\pi}\int^\infty_{-\infty}\int^\infty_{-\infty}{\rm exp}\left(-\dfrac{x^2+y^2}{2}\right)dxdy\\ \underset{極座標系への変換}{=}&\dfrac{1}{2\pi}\int^{2\pi}_{0}\int^\infty_{0}{\rm exp}\left(-\dfrac{r^2}{2}\right)\cdot rdrd\theta =\dfrac{1}{2\pi}\int^\infty_{0}{\rm exp}\left(-\dfrac{r^2}{2}\right)\cdot rdr\cdot \int^{2\pi}_{0}d\theta =\int^\infty_{0}{\rm exp}\left(-\dfrac{r^2}{2}\right)\cdot rdr\\ \underset{変数変換t=r^2/2}{=}&\int^\infty_{0}{\rm exp}\left(-\dfrac{r^2}{2}\right)\cdot rdr =\int^\infty_{0}{\rm exp}\left(-t\right)dt =\Big[-{\rm exp}(-t)\Big]^\infty_0 =1 \end{align}$$ となり, $a^2=1$を得るが, $a\ge 0$なので, $a=1$が分かる.
定理 正規分布$N(\mu,\sigma^2)$に従う確率変数$X$について, $$E(X)=\mu\qquad V(X)=\sigma^2$$ が成り立つ.
証明 変数変換$x=\mu+\sigma z$を行えば, 期待値$E(X)$は $$\begin{align} &E(X)=\int^\infty_{-\infty}x\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)dx =\int^\infty_{-\infty}(\mu+\sigma z)\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz\\ =&\mu\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz +\sigma\int^\infty_{-\infty}\dfrac{z}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz \underset{偶関数なので}{=}\mu\cdot P(-\infty\le Z\le \infty)+0\\ =&\mu \end{align}$$ である. また, 同様に, 変数変換$x=\mu+\sigma z$を行えば, 分散$V(X)$は $$\begin{align} &V(X)=E(X^2)-E(X)^2 = \int^\infty_{-\infty}x^2\dfrac{1}{\sqrt{2\pi}\sigma}{\rm exp}\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)dx-\mu^2\\ =&\int^\infty_{-\infty}(\mu+\sigma z)^2\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz-\mu^2 \underset{先と同様の計算をして整理する}{=}\int^\infty_{-\infty}\sigma^2 z^2\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz\\ =&\int^\infty_{-\infty}\sigma^2 z\cdot\left(-\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)\right)^\prime dz \underset{部分積分}{=}-\left[\dfrac{\sigma^2z}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)\right]^\infty_{-\infty}+\sigma^2\int^\infty_{-\infty}\dfrac{1}{\sqrt{2\pi}}{\rm exp}\left(-\dfrac{z^2}{2}\right)dz \\ =&0+\sigma^2\cdot P(-\infty\le Z\le \infty) =\sigma^2 \end{align}$$ である.
中心極限定理 $X_1,X_2,X_3,\cdots$が独立同分布に従うとする. このとき, 十分大きな$n$について, 平均の確率変数 $$\bar{X}=\dfrac{X_1+X_2+\cdots+X_n}{n}$$ は近似的に正規分布$N\left(\mu,\dfrac{\sigma^2}{n}\right)$に従う.
この定理の証明は省略する. この定理から, 再現可能な試行(実験)を繰り返し行うところには, 必ず正規分布が付随することが分かる. 正規分布は確率分布の中で, 科学上最も重要な確率分布と言えよう.