標準偏差と標準化

こんにちは、サポーターの小高です。 みなさんは統計学にどんな印象を持っていますか。中学校で習う統計は暗記が中心で、他の数学分野に比べて面白さを感じにくいかもしれません。

しかし、実際にデータを扱ってみると、ただ数値を眺めているだけでは気づけなかった特徴が、統計的な手法によってはっきりと見えてくることがあります。今回はその中でも「標準偏差」と「標準化」に注目してみましょう。

標準偏差は、データのばらつきを表す代表的な指標です。 値が大きいほどデータが広く散らばっていることを意味します。

ただし、今回注目したいのは「異なる種類のデータを比較できるようにする」という標準偏差のもう一つの役割です。

例えば、次の2つのデータを比較するとします。

身長:{150, 158, 170, 182, 190} cm

数学:{30, 55, 60, 65, 95} 点

まず平均を求めると、 身長は 170 cm、数学は 61 になります。

次に、それぞれの値から平均との差を求めると、

身長:{-20, -12, 0, 12, 20}

数学:{-31, -6, -1, 4, 34}

となります。

これらを2乗して平均し、平方根をとると標準偏差が求まります。

身長の標準偏差:14.75

数学の標準偏差:20.83

数学のほうがばらつきが大きいことがわかりますね。

次に、平均との差を標準偏差で割って「標準化」してみます。

身長:{-1.36, -0.81, 0, 0.81, 1.36}

数学:{-1.49, -0.29, -0.05, 0.19, 1.63}

この標準化された値は、単位の違うデータを同じ尺度で比較できるようにしたものです。

TOP