こんにちは、サポーターの小高です。 みなさんは統計学にどんな印象を持っていますか。中学校で習う統計は暗記が中心で、他の数学分野に比べて面白さを感じにくいかもしれません。
しかし、実際にデータを扱ってみると、ただ数値を眺めているだけでは気づけなかった特徴が、統計的な手法によってはっきりと見えてくることがあります。今回はその中でも「標準偏差」と「標準化」に注目してみましょう。
標準偏差は、データのばらつきを表す代表的な指標です。 値が大きいほどデータが広く散らばっていることを意味します。
ただし、今回注目したいのは「異なる種類のデータを比較できるようにする」という標準偏差のもう一つの役割です。
例えば、次の2つのデータを比較するとします。
身長:{150, 158, 170, 182, 190} cm
数学:{30, 55, 60, 65, 95} 点
まず平均を求めると、 身長は 170 cm、数学は 61 点 になります。
次に、それぞれの値から平均との差を求めると、
身長:{-20, -12, 0, 12, 20}
数学:{-31, -6, -1, 4, 34}
となります。
これらを2乗して平均し、平方根をとると標準偏差が求まります。
身長の標準偏差:14.75
数学の標準偏差:20.83
数学のほうがばらつきが大きいことがわかりますね。
次に、平均との差を標準偏差で割って「標準化」してみます。
身長:{-1.36, -0.81, 0, 0.81, 1.36}
数学:{-1.49, -0.29, -0.05, 0.19, 1.63}
この標準化された値は、単位の違うデータを同じ尺度で比較できるようにしたものです。
-
公立高校入試まで残り30日
記事がありません