ヒストグラムで可視化しよう
こんにちは、徳です。
デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。
現在は、初心者なので、とにかくゆっくり進んでいくと思います。
また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。
では、いきましょう!
統計学
今回は、
度数分布表とヒストグラムについて
勉強していこうと思います。
こちらの二つは、
記述統計
で使われます。
データをたくさん持っていても、そのままでは何もわかりません。
貴重なデータでも整理しないとバラバラの数字でしかないですよね。
その整理の仕方として、
表・グラフにして可視化
することがあります。
なぜなら、
表やグラフにすると、ひと目でデータの大まかな傾向や特徴を掴むことできる
出典:「ゼロからはじめる!統計学見るだけノート」より
からです。
せっかく持っているデータです。
そのままではわからないことも、可視化することで何か見つけられるかもしれません。
今回は、その中の二つである
度数分布表・ヒストグラム
です。
度数分布表
度数分布表とは
度数分布表とは、
ある区間別に現れるデータの個数を記録し表にした
ものです。
使われる単語
度数分布図で使われる単語に
- 階級
- 度数
- 相対度数
- 累積相対度数
があります。
階級
階級とは、
度数分布図として分ける区間
のことです。
集めたデータで各階級にいくつのデータがあるかを数えます。
また、その階級の真ん中に当たる値を
階級値
と呼びます。
度数
度数とは
各階級にあるデータの件数
のことです。
相対度数
相対度数とは、
その階級の全体での割合
を知ることができます。
求め方は、
度数 ÷ 全データ数
です。
累積相対数
累積相対度数とは、
小さい階級から順に相対度数を加えたもの
です。
加えるため、その階級までで全体の何割かを知ることができます。
実際のところ、表にしただけでは、まだ特徴がわかりづらいですよね。
また、度数分布表に「相対度数」「累積相対度数」を入れないこともあります。
ヒストグラム
ヒストグラムとは
ヒストグラムとは、
度数分布表を棒グラフにグラフ化
したものです。
ヒストグラムでは、横軸に階級・縦軸に度数を表示します。
ヒストグラムを作ることで、データの可視化ができるようになり、特徴や癖を見つけることができるようになります。
もちろんここでのデータは過去のデータであるため、「その傾向にある」ということです。
データの量が多いほど、そのグラフもより正確になります。
まとめ
今回は、
度数分布表とヒストグラムについて
紹介させていただきました。
統計学で重要なことは、データを可視化して、今まで見えなかった特徴を見つけることです。
度数分布表とヒストグラムはその一つの例です。
実際にやることは、データの選別と表・グラフ化のみなので、そんなに難しいことはしていません。
統計学での最初の一歩になります。
最後まで読んでいただきありがとうございました。
コメント