パターン識別 (3) 中心極限定理
パターン識別(2006/6/9)を読む。
p.78のコンピュータ演習5を解いてみる。いわゆる中心極限定理をシミュレーションしてみろって問題(定理の意味はキーワードリンク先参照)。Rの勉強もかねてプログラムを書いてみた。
central_limit_theorem <- function() { samples <- c(); # 標本の平均を格納するベクトル count <- 0; # 標本の数 while (count < 10000) { # 10000個の標本を生成 s <- runif(30, 0, 1); # 0-1の一様乱数から30個生成(標本) count <- count + 1; samples <- c(samples, mean(s)); # 標本の平均を追加 } hist(samples); # ヒストグラムを表示 }
結果はこうなる。ちゃんと正規分布になってます。
Rはすごいなー。極めるとかなり便利そう。
今回は同じ0-1の一様分布から大きさ30の標本を10000個作ってヒストグラムを書いたけど演習5はちょっと違う。いろんな一様分布から大きさランダムの標本を作れって書いてあるんだけどこれだとなんかうまくいかない。正規分布っぽいのできないなぁ。なぜだ。