学問

Step:02[1変数データ]

統計学「歪度 ~平均からどちら側に値がよっている?~」

分布を比較するときなどに使用する値は「平均値」「分散」「標準偏差」などがあります。 しかし、分散や標準偏差まで見てもどちらにズレているかまではわかりません。 そんな平均からのズレの方向を知ることができる値が「歪度」です。歪度によって、「平均より大きい値が多い傾向にある」「小さい方が多い傾向にある」が知ることができます。
Step:02[1変数データ]

統計学「ジニ係数 ~データの格差の数値化~」

こちらの記事は、「ジニ係数」についての説明です。 ジニ係数とは、格差を数値で表した値です。「会社の給料の割り振り」など格差というのはたくさんあります。 しかし、その格差を比べるのは難しいですよね。こちらのジニ係数を求めることで数値となるため比較することができるようになります。
Step:02[1変数データ]

統計学「ローレンツ曲線 ~データの格差を見つける~」

こちらはローレンツ曲線を紹介した記事です。 データを4分割・5分割した時、どの部分にどのくらい集まっているのかを知ることができる曲線です。 この曲線を書くことで、データの格差を見つけることができます。また、累積相対度数を使用するため、単位の異なるデータとの比較にも使用できます。
Step:02[1変数データ]

統計学「箱ひげ図」

複数のデータを平均値以外で比較したい人必見! こちらの記事は、箱ひげ図について紹介しています。箱ひげ図は、最小値・第1四分位数・中央値・第3四分位数・最大値の5つで作成されます。 5つとも平均値とは関係のない値のため、平均値に関わらず比較することができます。
Step:02[1変数データ]

統計学「四分位数」

箱ひげ図を求めるとき、第1四分位数・第3四分位数を求めます。 この二つの値が何の値なのかわからない人必見!この記事では、四分位数の説明をします。 四分位数とは、データの数を4等分した時のそれぞれの値です。データ数を4つに分けるため、それぞれで25%のデータ数がある範囲が求めることができます。
Step:02[1変数データ]

統計学「はずれ値」

集計したデータに極端に離れた値はありませんか? その値を入れたまま平均値などを求めたら、一気に値が変化してしまうこともあり得ます。 その場合は、「はずれ値」か否かを判断してみましょう。はずれ値であるのならその値を抜いた時に平均値なども求めて検討しましょう。
Step:02[1変数データ]

統計学「偏差値」

偏差値は、データの優秀さを数値で見つけられます。 平均値を偏差値50として、そのデータがどの位置にあるかを数値化した指標です。 また、これからの予測にも使用できます。注意点としては、ある程度のデータ数が必要です。
Step:02[1変数データ]

統計学「標準偏差」

標準偏差とは、データのバラツキの平均です。 求め方は、「標準偏差=√分散」です。偏差平方和を求めるときにバラツキの値を2乗しているため、ルートで2乗を消しましょう。 標準偏差を使うことで、データの傾向を掴みやすくなります。
Step:02[1変数データ]

統計学「分散」

分散とは、散らばりの合計 (標準偏差) / データ数です。 つまり、平均を求める式になります。この値が大きいほど、平均から離れている値が多く、小さいほど平均値付近のデータが多いということがわかります。 また、分散から「標準偏差」という値が解けるため、考え方などを覚えましょう。
Step:02[1変数データ]

統計学「偏差平方和」

偏差平方和とは、平均値からの離れ具合の合計です。 平均値や最頻値が同じでも全く同じデータというのはなかなかありません。そんなときは、各データの平均値からの距離がどれくらい離れているかから調べましょう。 また、偏差平方和から、「分散」や「標準偏差」などが求められます。