2011年11月24日木曜日

統計の話2 ばらつき

ばらつき
ばらつきを示す主なものとして範囲(range)、標準偏差(standard deviation:SD)、四分位範囲(ineter-quartile range)があります。

範囲
範囲はデータがどこからどこまでの範囲に分布しているかを示すものです。最大値と最小値で示されます。例えばテストの最高点数がが99、最低点が15であれば15~99点となります。

標準偏差
標準偏差もデータのばらつきを示す数値です。
例えばY柔整A3の体重を測定したところ平均 75±9kgだったとした場合どのように解釈するか?

ずばりいうと標準偏差とは「得られたデータの約95%は平均値-標準偏差×2から平均値+標準偏差×2の間に存在する。」と言うことになります。

つまり上記の例だと標準偏差×2ということで平均値-18から+18の間、
すなわちA3の95%は57kgから93kgの間の体重である。ということになります。
ちなみに平均値±標準偏差×1(1SD)は約68%になります。


以下の図は各施術者によって足関節のテーピングを実費でいくらもらいたいかというのを表にしたものです。平均値と中央値、標準偏差を出してみて下さい。ちなみにこの場合の標準偏差はEXCELの関数ではSTDEVPです。

実際に計算してくれた人がいるかどうかは別として、
この20人の平均値および標準偏差は1955±4631円です。中央値は500円です。

テーピングの実費代をもらうとして平均の1955円か中央値の500円かどちらが適当と思いますか?

この場合平均値よりも中央値の方が実態に近いと思われます。すなわち代表値として適切だと思われます。このようにデータに偏りがある場合平均値は使えません。
標準偏差は1955-4631円ということでマイナスになってしまいます。平均と同様に標準偏差もデータに偏りがある場合使えません。

0 件のコメント: