統計学「度数分布表とヒストグラム」

Step:01[データ分布]

ヒストグラムで可視化しよう

こんにちは、徳です。

デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。

現在は、初心者なので、とにかくゆっくり進んでいくと思います。

また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。

では、いきましょう!


統計学


今回は、

度数分布表とヒストグラムについて

勉強していこうと思います。

こちらの二つは、

記述統計

で使われます。

データをたくさん持っていても、そのままでは何もわかりません。

徳

貴重なデータでも整理しないとバラバラの数字でしかないですよね。

その整理の仕方として、

表・グラフにして可視化

することがあります。

なぜなら、

表やグラフにすると、ひと目でデータの大まかな傾向や特徴を掴むことできる

出典:「ゼロからはじめる!統計学見るだけノート」より

からです。

せっかく持っているデータです。

そのままではわからないことも、可視化することで何か見つけられるかもしれません。

今回は、その中の二つである

度数分布表・ヒストグラム

です。


度数分布表

度数分布表とは

度数分布表とは、

ある区間別に現れるデータの個数を記録し表にした

ものです。

例えば

ある大学生70人の身長

徳

このようなデータだけを持っていても何もわかりませんね。

この表を

このように整理したものが度数分布表です。

使われる単語

度数分布図で使われる単語に

  • 階級
  • 度数
  • 相対度数
  • 累積相対度数

があります。

階級

階級とは、

度数分布図として分ける区間

のことです。

集めたデータで各階級にいくつのデータがあるかを数えます。

また、その階級の真ん中に当たる値を

階級値

と呼びます。

例えば

階級が、171~175 なら、階級値は173になります。

度数

度数とは

各階級にあるデータの件数

のことです。

相対度数

相対度数とは、

その階級の全体での割合

を知ることができます。

求め方は、

度数 ÷ 全データ数

です。

累積相対数

累積相対度数とは、

小さい階級から順に相対度数を加えたもの

です。

加えるため、その階級までで全体の何割かを知ることができます。

徳

実際のところ、表にしただけでは、まだ特徴がわかりづらいですよね。

また、度数分布表に「相対度数」「累積相対度数」を入れないこともあります。

ヒストグラム

ヒストグラムとは

ヒストグラムとは、

度数分布表を棒グラフにグラフ化

したものです。

例えば

先程の度数分布表

こちらをヒストグラムにすると

こうなります。

徳

だいぶ、特徴が見えるようになってきましたね。

ヒストグラムでは、横軸に階級縦軸に度数を表示します。

ヒストグラムを作ることで、データの可視化ができるようになり、特徴や癖を見つけることができるようになります。

徳

もちろんここでのデータは過去のデータであるため、「その傾向にある」ということです。

データの量が多いほど、そのグラフもより正確になります。

まとめ

今回は、

度数分布表とヒストグラムについて

紹介させていただきました。

統計学で重要なことは、データを可視化して、今まで見えなかった特徴を見つけることです。

度数分布表とヒストグラムはその一つの例です。

実際にやることは、データの選別と表・グラフ化のみなので、そんなに難しいことはしていません。

統計学での最初の一歩になります。

最後まで読んでいただきありがとうございました。

コメント

タイトルとURLをコピーしました