データの分類
統計データを大きく分けると、量的データ(数量データ)と質的データ(カテゴリーデータ)に分けられます。
尺度による分類
量 |
間隔尺度 interval scale |
目盛が等間隔になっているもの。 和差に意味があるが比率には意味がない |
摂氏温度など ※10℃と20℃は2倍の関係ではない |
比尺度 ratio scale |
大きさ・比に意味があり、値0が絶対的な起点としての意味をもつもの。 和差積商の計算が自由にできる |
身長、絶対温度など | |
質 的 デ l タ |
名義尺度 nominal scale |
分類するために番号として数値を割り当てたもの | 性別 男1;女2 など |
順序尺度 ordinal scale |
順序に意味があるものの、間隔には意味がない数値を割り当てたもの | 都道府県ランキング1位, 2位 など |
データの連続性による量的データの分類
量 的 デ l タ |
連続型データ continuous data |
取りうる値に隙間がなく連続になっている値。 連続型の確率変数 |
身長、体重など |
離散型データ discrete data |
取りうる値がとびとびである値。 離散型の確率変数 |
サイコロの目、トランプの札の数字など |
量的データ
量的な尺度で計測された数値で表されるデータです。
この尺度は、間隔尺度(差が意味をもつ尺度)または比尺度(差と比が意味をもつ尺度)になります。したがって、データ間の大小関係を比較したり、演算を行ったりしたときに意味のある数値となります。
また、量的データは、データの数値の連続性の有無という観点によって、連続データ(取りうる値に隙間がなく連続になっている値)と離散データ(取りうる値がとびとびになっている値)に分けられます。
身長などの連続型データでも、計測したデータは有効数字の関係からとびとびの値になります(離散型のデータになりうる)。しかし、目盛りが非常に細かく、取り得る値が多くなるデータであるため、連続データとして扱います。
質的データ
類別するために数値を与えられたデータです。
名義尺度(区別だけをする尺度)または順序尺度(区別に順序がつく尺度)によって計測されます。データ間の大小比較や演算をしても無意味で、ここでの数値は単なる分類の意味しか持ちません 。