量的データは数字・質的データはそれ以外
こんにちは、徳です。
デジタルDIYができるようコーディング・プログラミング・画像加工・動画編集などを本やYouTubeで勉強しています。
現在は、初心者なので、とにかくゆっくり進んでいくと思います。
また、「間違っていること」や「こうした方が良いよ」などがあれば、コメントなどしていただけたら幸いです。
では、いきましょう!
統計学
今回は、
統計学での「データ」
について勉強していこうと思います。
データは、統計学ではとても重要です。
統計学でできる分析・推測はデータから考えるからです。
そして、データは様々な分け方があります。
分析推測したいことにより、データの取り方も代わります。
データ
統計学においてデータは必須です。
そのデータには、さまざまな分類方法があります。
いくつか見ていきましょう。
量的データと質的データ
量的データ
量的データというのは
数字のデータ
です。
また、質的データは、
比率尺度・間隔尺度
の分けられます。
比率尺度
特徴としては、
0という数字がなしを意味する
ところです。
0をなしと捉えるため、負の数値になることはありません。
度数・平均値・最頻値・中央値・標準偏差など様々な指数が利用できます。
間隔尺度
特徴としては、
0がなしと意味しない
ところです。
度数・平均値・最頻値・中央値・標準偏差など様々な指数が利用できます。
質的データ
質量データとは
数字以外のデータ
です。
また、質量データは
順序尺度・名義尺度
に分けられます。
順序尺度
特徴として、
順番に意味のある
分け方です。
度数や最頻値・中央値は利用できます。
しかし、項目一つ一つを数字に置き換えたとしても、計算に意味がないため、平均値は利用で来ません。
名義尺度
特徴として、
順番に意味のない
分け方です。
ただ、一つ一つを分けただけなので、順番に良し悪しはありません。
度数や最頻値は利用できます。
しかし、数字に置きかえたとしても、順番に意味がないため、平均値・中央値は利用できません。
一次元データ・二次元データ・多次元データ
一次元データ
一次元データとは、
1つの個体に対して、一つの観測結果があるデータのまとまり
のことです。
名前 | 身長 |
A | 164cm |
B | 184cm |
C | 159cm |
D | 166cm |
E | 175cm |
このように、データ項目は1つあります。
二次元データ
二次元データとは、
1つの個体に対して、2つの観測結果があるデータのまとまり
です。
番号 | 重さ | サイズ |
1 | 75g | M |
2 | 50g | S |
3 | 100g | L |
4 | 42g | S |
5 | 80g | L |
このように、データ項目が二つあります。
多次元データ
多次元データとは、
1つの個体に対して、複数個の観測結果があるデータのまとまり
です。
名前 | 国語 | 数学 | 英語 |
A | 50 | 80 | 30 |
B | 80 | 30 | 50 |
C | 30 | 50 | 80 |
D | 50 | 50 | 50 |
E | 100 | 100 | 100 |
このように、データ項目が複数個あります。
つまり、「二次元データ」は「多次元データ」の一つです。
まとめ
今回は、
統計学におけるデータについて
紹介させていただきました。
統計学において、データはとても重要です。
なぜなら、統計で出せる分析や推測は、全てデータからくる結果だからです。
今回は、
量的データと質的データ
一次元データ・二次元データ・多次元データ
の二つの分け方を説明させていただきました。
他にも様々な分け方があります。
何を分析推測したいかによって、使用するデータも変わってきます。
最後まで読んでいただきありがとうございました。
コメント