2011年12月8日木曜日

区間推定

母集団(それについて知りたいと思う、全体のデータを母集団という)の調査・研究をすることは時間や労力等により困難です。そこで母集団の一部(標本)を抽出しその平均値などから統計学的に母集団の値を推定します。

例1:全国全ての柔整学校の男子生徒の平均体重を出すことは大変です。そこでいくつかの学校から何人かの人をランダムに選び、その平均値から全国の柔整学校の男子生徒の平均体重を推定します。

例2:全国の60代の膝が痛い女性の体脂肪率を知りたいと思っても、実際全ての人を計測することは不可能です。このため何人かサンプルをランダムに選んで計測しその平均値から母集団(全国の60代の膝が痛い女性)の体脂肪率の平均値を推定します。

人数が多ければ標本の平均は母集団の平均に近づきますが、完全には一致することはあり得ません。そこで母平均(真の平均値)が95%とか99%の高い確率でこれくらいの間にあるだろうという範囲を推定する方法を区間推定といいます。

上記の例でいえば95%の確率で全国全ての柔整学校の男子生徒の平均体重は○○kg~△△kgの間にある。
99%の確率で全国の60代の膝が痛い女性の体脂肪率は○○%~△△%の間にある。
これらの○○~△△の値を求めるのが区間推定というわけです。
当然サンプル数が少なければその範囲は広く、多ければ範囲は狭くなります。また95%より99%の方が範囲が広くなります。
そして
「95%の確率で母平均が含まれるような範囲」を95%信頼区間、
「99%の確率で母平均が含まれるような範囲」を99%信頼区間といいます。

1 件のコメント:

うめしゅう さんのコメント...

昔はスポーツ少年団の母親の集まりを「母集団」といいました。