2012年3月13日火曜日

t検定

t検定はスチューデントのt検定(Student's t-test)とも呼ばれますが、これは統計学者のウィリアム・ゴセットが雇用者であるギネスビール社に本名使用を許されずStudent というペンネームで最初の論文を発表したためだそうです。
t検定は例えば筋力トレーニング群とトレーニング無し群で1ヶ月後に改善した最大歩行速度の平均に差があるかないかを調べたり、
バナナダイエットをして元の体重の平均と1ヶ月後の体重の平均に差があるかどうかを調べるときなどに使用します。

t検定を行う前に前提条件がありますので確認しておきます。
まず2標本の差の検定をおこなうのか、対応のある2変数の差の検定をおこなうのかによって計算が違ってきます。
2標本の差の検定は上記で言えばトレーニング群とトレーニング無し群のように両群が全く異なる対象者の場合に使用します。この場合nの数が等しくなくてもかまいません。
対応のある2変数の差の検定は1つの群を対象とします。つまり上記のバナナダイエットのように同じ人達でダイエット前の平均体重とダイエット後の平均体重を測定し、その差があるのかないのかを知りたい場合使用します。当然ダイエット前とダイエット後の人は別人であってはならず、ダイエット前のnとダイエット後のnは等しくなります。

次に、
t検定は2つの母集団がいずれも正規分布に従っているときに、平均が等しいかどうかを調べる検定であるため、まず正規分布(正規分布の時には代表値に平均を用い、非正規分布の場合には代表値として中央値を使用します)かどうか調べる必要があります。
標本が正規分布に従うかどうかは、シャピロ-ウィルク検定などの正規性検定によって判断します。シャピロ-ウィルク検定については次回に述べたいと思います。

次に、
等分散するかどうかを調べます。等分散とは、漢字を見て分けるとおり等しく分散しているということです。つまり、それぞれの群の分布の形が似ているということです。(下図参照)
2標本の差の検定の場合、「正規分布である」「等分散である」の二つの条件が必要です。そのため、たとえ正規分布していても等分散でなければt検定を使えません。この等分散かどうかを調べるためにF検定やルベーン検定があります。もし、これらの検定で「等分散でない」と検定されたなら二標本t検定ではなくてWelch法等で検定しなくてはなりません。

0 件のコメント: