統計学「標準化」

Step:02[1変数データ]

正規分布を標準正規分布に変える

こんにちは、徳です。

デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。

現在は、初心者なので、とにかくゆっくり進んでいくと思います。

また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。

では、いきましょう!

統計学


今回は、

標準化

について勉強していこうと思います。


標準化

標準化とは

標準化とは、

正規分布を標準正規分布に変えること

です。

正規分布とは

正規分布とは、

このような形の分布のことです。

多くのデータ分布は、正規分布に従うとされています。

出典:「ゼロからはじめる! 統計学見るだけノート」より

つまり、

データをたくさん集めるほど正規分布になっていく集団が多い

ということです。

徳

実際、この文を読んだときに私の感想は、

正規分布のようにならないことの方が多いんじゃないかな

でした。

しかし、他の本やネットで検索してもそう出ているので、多いのでしょう。

標準正規分布とは

標準正規分布とは、

正規分布の中でも平均値0・標準偏差1の分布のこと

です。

用途

正規分布における

ある値1からある値2までが出る確率を求める

時に使用します。

つまり、今までのデータから

この間が出る確率がどのくらいあるのかを求めることができます。

徳

確率がわかれば、これからのデータの推測に使えますよね。

なぜ標準化するのか?

なぜなら、標準正規分布には、標準正規分布表というものがありこちらを使って確率を求めることがでいるからです。

徳

これを使うことにより、その範囲に入る確率が簡単に解けるのです。

値を覚える必要はありません。

使い方を覚えましょう。

標準化されていない正規分布では、

  • -σ ≦ x ≦ σの確率は約68%
  • -2σ ≦ x ≦ 2σの確率は約95%
  • -3σ ≦ x ≦ 3σの確率は約99.8%

ということはわかりますが、他の値の確率は解くのは難しいです。

しかし、標準化された後の確率は標準正規分布表に出ているため、正規分布を標準化することにより確率を求めることができます。

求め方

標準化の求め方は、

です。

zとは標準正規分布でのデータの値です。

標準化するということは、左のグラフを

右にグラフに変化させるということです。

つまり、まず平均値を0にします。

データ-平均値

その後、標準偏差σを1にします。

(データ-平均値) / 標準偏差

これで、標準正規分布に変更できます。

つまり、正規分布の確率を求めたい場合、

正規分布の確率を求めたい

    ↓ 標準化

標準正規分布にする

標準正規分布表を使って確率を出す

と考えます。

標準化の仕方

平均値150・標準偏差10の確率での、160 ~ 170 になる確率を求めてみましょう。

標準化の求め方は、

です。

1、平均値を0にする

データは

160170

です。

よって、

160-150 = 10 と170-150 = 20

となります。

2、標準偏差の1にする

標準偏差を1にするため、σで割ります。

10/10 = 1 と 20/10 = 2

となります。

これで、

  • 160を標準化すると1
  • 170を標準化すると2

となります。

徳

これであとは、標準偏差分布表で1~2の確率を見れば求められます。

まとめ

今回は、「標準化」について紹介させていただきました。

標準化は、

正規分布を標準正規分布に変える

ことです。

標準化することで、

細かい範囲での確率を求める

ことができます。

標準化するとは、

平均値0・標準偏差1の正規分布にする

ということです。

求め方は、

です。

つまり、

  • 平均値を引くことで平均値を0
  • 標準偏差で割ることで標準偏差を1

にします。

最後まで読んでいただき、ありがとうございました。

コメント

タイトルとURLをコピーしました