2011年12月9日金曜日

信頼区間の求め方

計算はまず不偏分散を求めます。
不偏分散=((データ-平均値)2)の総和÷(サンプルサイズ-1)
エクセルでは関数VARでデータを選択すれば一発で出ます。フォントの都合で上付きに出ませんが(データ-平均値)の2乗です。

不偏分散は分散とよくにてますが分散は((データ-平均値)2)の総和÷サンプルサイズです。母平均と標本平均はほぼ一致してきますが、標本分散は母分散より大きくなるとのことでサンプルサイズから1を引いて分母を大きくして誤差を修正します。

次に標準誤差を求めます。
標準誤差=√(不偏分散÷サンプルサイズ)
(ルートのかかる範囲がわかりにくいですが不偏分散÷サンプルサイズのルートです)

そして
信頼区間=標本平均±t×標準誤差となります。
t値はt分布(下図)を使います。自由度は(サンプルサイズ-1)になります。例えばサンプル数が10であれば自由度は9になります。例えば150なら自由度は∞になります。自由度をなぜサンプルサイズ-1とするのかは理由があるそうですが、自分には理解できませんでした。

ややこしくみえますが計算自体は非常に簡単です。(不偏分散の計算は面倒なので統計ソフトで行います)

それでは具体的に計算してみたいと思います。
全国の柔整学校の男子生徒の体重の平均を推定するためランダムに500人分のデータを得た。500人分のデータは平均が65kg、不偏分散が60であった。95%信頼区間と99%信頼区間を求めなさい。(小数点第3位を四捨五入)

まず標準誤差を上の計算式に当てはめて計算します。
標準誤差=√(60÷500)≒0.35 

標準誤差が求められたところで信頼区間を計算します。
t値はサンプル数500なので∞の値とし、95%が1.960、99%が2.576です。
そしてこれを当てはめます。
95%信頼区間=65±1.960×0.35=65±0.69kg=64.31~65.69 
99%信頼区間=65±2.576×0.35=65±0.90kg=64.10~65.90

これは
全国の柔整学校の男子生徒の平均体重は95%の確率で64.31~65.69kgの間にある。
全国の柔整学校の男子生徒の平均体重は99%の確率で64.10~65.90kgの間にある。
と解釈できることになります。

0 件のコメント: