統計学「偏差 ~各データの平均値からの差~」

Step:02[1変数データ]

各データの平均からの差

こんにちは、徳です。

デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。

現在は、初心者なので、とにかくゆっくり進んでいくと思います。

また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。

では、いきましょう!


統計学

今回は、

偏差

について勉強していこうと思います。

たくさんのデータから傾向を調べるときに使用するものの一つに平均値があります。

しかし、

  • 平均値が同じだから同じような傾向のデータ
  • 平均値が全然違うから全く傾向が違うデータ

とは言い切れません。

そんなときに使用する指標の一つが偏差です。

それではよろしくお願いします。


偏差

偏差とは

偏差とは、

集めたデータ一つ一つの平均値との差

です。

この二つのヒストグラムは、平均値・中央値・最頻値は同じです。

しかし、とても同じデータの集まりとは思えませんよね?

何が違うでしょうか?

答えは、

各データの平均からの離れ具合

です。

左のように平均とあまり差が少ない場合、それ以降データを集めていっても大きく動かないような予測を立てられます。

しかし、右のグラフは平均値とその周りの値の度数の差があまりないため、データが増えるほど平均値・中央値・最頻値どれも大きく動くかもしれないという予測を立てられます。

このように、平均値・中央値・最頻値だけでなく、

平均値からの差である偏差

からも統計を見てみましょう。

求め方

求め方は、

偏差 = データ – 平均

です。

徳

データ一つひとつが平均値とどのくらい離れているかです。

特徴

平均値などの違いではみられない違いがわかることもある

先ほど話したように、平均値・中央値・最頻値がどれも同じでも、全く違うヒストグラムになる事がよくあります。

その時は、この偏差を求めて平均からの散らばりから違いを考えてみましょう

偏差から他の値を求められる

偏差も統計学で使われる値の一つです。

しかし、偏差のみで傾向を見るのではなく、その偏差を使って求める

標準偏差・偏差平方和・分散

などがあります。

偏差は、その値を求めるための基本となる値です。

注意点

合計は0

対策:偏差の合計は統計に使わない

偏差とは、平均値からの各データの差です。

つまり、真ん中の値からの距離となり、平均値より大きければ正の数、小さければ負の数になります。

そして、全てを足すと必ず0になります。

そのため、偏差の合計は統計には使えません。

まとめ

今回は、

偏差について

紹介させていただきました。

この値は、平均値からの各データの差です。

平均値・中央値・最頻値ではわからない傾向を掴むのに重要になる値です。

また、特徴にも書きましたが、この値から

標準偏差・偏差平行和・分散

などの統計学でもっと使われる値を求めます。

そちらを理解するためにも重要な値になります。

求め方や特徴を理解し、データの一つとして求めてみましょう。

最後まで読んでいただきありがとうございました。

コメント

タイトルとURLをコピーしました