統計学「ローレンツ曲線 ~データの格差を見つける~」

Step:02[1変数データ]

相対度数から格差を見つける

こんにちは、徳です。

デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。

現在は、初心者なので、とにかくゆっくり進んでいくと思います。

また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。

では、いきましょう!


統計学

今回は、

ローレンツ曲線

について紹介します。

よく、

会社全体が支払う給料の80%は上位5%に支払われる

(数字は架空のものです)

など聞いたことありませんか?

徳

この数字でいくと、

残りの20%を95%の人で分けていることになりますよね。

このようなものを

格差

と言います。

徳

完全に均等とはいかないにしても、

広すぎる格差は不均等ですよね。

今回は、そんな格差を曲線で表した

ローレンツ曲線

についての説明です。

それでは、よろしくお願いします。


ローレンツ曲線とは

ローレンツ曲線とは

まずローレンツ曲線を見てみましょう。

ローレンツ曲線とは、

このような曲線のことです。

徳

曲がっている線のことをローレンツ曲線と言います。

こちらは、大きく二つの線、

完全平等線

ローレンツ曲線

があります。

完全平等線

完全平等線とは、

全く格差のない時の線

です。

徳

全体を綺麗に四等分されたときの

ローレンツ曲線はこの線と同じになります。

実際には、

ローレンツ曲線が完全平等線とどのくらい離れているかを見る

ために使用します。

ローレンツ曲線

このように、

左辺・下辺ともに累積相対度数の折れ線グラフ

になります。

徳

こちらでは5等分していますが、

4等分・10等分などでも問題ありません。

完全平等線との乖離具合で格差がどのくらいあるかを見ます。

徳

ちなみに全く格差がない場合、

ローレンツ曲線は完全平等線と同じになります。

必ず

最初の点

0

最後の点

1

になります。

また、ローレンツ曲線のいい点は、

元のデータの単位によらない

ことです。

徳

両辺とも累積相対度数のため、

二つの曲線を比較するとき、そのまま一緒のグラフに書けます。

使い方

ローレンツ曲線の使い方としては、主に

  • 両辺の値から各部分の割合を見つける
  • 二つを見比べて乖離具合を比較する
  • ジニ係数を求める

などがあります。

両辺の値から各部分の割合を見つける

先ほどのローレンツ曲線を見ると、

  • Bが半分の時のAの割合が約7割ある
  • Aの上位2割がBの約4割を占めている

などがわかります。

Bが半分の時のAの割合が約7割ある

グラフの

この部分を見ることでわかります。

Aの上位2割がBの約4割を占めている

グラフの

この部分を見ることでわかります。

つまり、

残りの6割を8割が占める

ということです。

徳

これが格差ですね。

二つを見比べて乖離具合を比較する

例えば、

があるとします。

徳

先ほども書きましたが、単位によらないため、

このようにまとめて曲線を書けます。

この2本の曲線を見比べると、

  • よりの方が格差が少ない
  • の0.4までの割合をは0.8が占めている

などを見つけることができます。

よりの方が格差が少ない

グラフの

この部分を見ることでわかります。

面積が大きいほど、

格差が大きい

ということになります。

の0.4までの割合をは0.8が占めている

グラフの

この部分を見ることでわかります。

つまり、

残りの6割を8割が占める

ということです。

徳

これが格差ですね。

ジニ係数を求める

ローレンツ曲線から時に係数を求めることができます。

ジニ係数とは、

格差を数値で表した係数

です。

徳

ローレンツ曲線の面積から求めます。

ローレンツ曲線の作り方

ローレンツ曲線の作り方は、

①データを小さい順に並べる

②各累積相対度数と求める

③折れ線グラフを作る

です。

ある大学生70人の身長

このデータのローレンツ曲線を書きましょう。

横軸

人の累積相対度数

縦軸

身長の累積相対度数

として考えましょう。

1、データを小さい順に並べる

まずは、データを小さい順に並べましょう。

2、各累積相対度数を求める

では、各累積相対度数を求めましょう。

2.1、横軸の累積相対度数

今回、横軸は人にしました。

そのため、

人の累積相対度数

を求めましょう。

2.1.1、合計を求める

人の合計は、

70人

です。

2.1.2、分けたい分にデータを分ける

今回は、5等分します。

徳

つまり、20%づつですね。

よって、

1~14人目

15~28人目

29~42人目

43~56人目

57~70人目

となります。

2.1.3、累積相対度数を求める

人の場合、どの人も1人であり差がないため、そのまま5等分で問題ありません。

よって、

1~14人目

0.2

15~28人目

0.4

29~42人目

0.6

43~56人目

0.8

57~70人目

1.0

となります。

2.2、縦軸の累積相対度数

縦軸は身長にしました。

そのため、身長の累積相対度数を求めます。

2.2.1、合計を求める

身長の合計は、

12341

です。

2.2.2、分けたい分にデータを分ける

今回は、5等分します。

徳

つまり、20%づつですね。

徳

今回は、元々5等分に分けていたため、

変化はありません。

2.2.3、各合計を求める

各合計を求めましょう。

2.2.4、相対度数を求める

次に、各相対度数を求めましょう。

2243 / 12341

= 0.18

2389 / 12341

= 0.19

2476 / 12341

= 0.20

2554 / 12341

= 0.21

2680 / 12341

= 0.22

となります。

2.2.5、累積相対度数を求める

次に、各累積相対度数を求めましょう。

よって、

1~14人目

0 + 0.18

= 0.18

15~28人目

0.18 + 0.19

= 0.37

29~42人目

0.37 + 0.20

= 0.57

43~56人目

0.57 + 0.21

= 0.78

57~70人目

0.78 + 0.22

= 1.00

となります。

3、折れ線グラフを作る

今求めた各累積相対度数から折れ線グラフを作りましょう。

徳

二つの累積相対度数から折れ線グラフを作りましょう。

徳

これでローレンツ曲線ができました。

今回は、それほど乖離のない結果になりました。

まとめ

今回、

ローレンツ曲線

について紹介させていただきました。

ローレンツ曲線とは、

データの乖離具合を調べる曲線

です。

ローレンツ曲線を求めるために必要なのは、

各累積相対度数

です。

ローレンツ曲線を求めることで、

  • 両辺の値から各部分の割合を見つける
  • 二つの曲線を見比べて乖離具合を比較する
  • ジニ係数を求める

などができます。

徳

ジニ係数を求めるときによく使用します。

乖離具合を調べることで、

全体の中の格差を知る

ことができます。

徳

4等分して、

  • 下位25%にどのくらいあるのか
  • 真ん中の50%にどのくらい集まっているのか

などを知ることができます。

最後まで読んでいただき、ありがとうございました。

コメント

タイトルとURLをコピーしました