データの種類


データの分類
 

統計データを大きく分けると、量的データ(数量データ)と質的データ(カテゴリーデータ)に分けられます。


尺度による分類





間隔尺度

interval scale

目盛が等間隔になっているもの。
和差に意味があるが比率には意味がない
摂氏温度など
※10℃と20℃は2倍の関係ではない

比尺度

ratio scale

大きさ・比に意味があり、値0が絶対的な起点としての意味をもつもの。
和差積商の計算が自由にできる
身長、絶対温度など




名義尺度

nominal scale

分類するために番号として数値を割り当てたもの 性別 男1;女2 など

順序尺度

ordinal scale

順序に意味があるものの、間隔には意味がない数値を割り当てたもの 都道府県ランキング1位, 2位 など

 

データの連続性による量的データの分類






 

連続型データ

continuous data

取りうる値に隙間がなく連続になっている値。
連続型の確率変数
身長、体重など

離散型データ

discrete data

取りうる値がとびとびである値。
離散型の確率変数
サイコロの目、トランプの札の数字など

 

量的データ

量的な尺度で計測された数値で表されるデータです。

この尺度は、間隔尺度(差が意味をもつ尺度)または比尺度(差と比が意味をもつ尺度)になります。したがって、データ間の大小関係を比較したり、演算を行ったりしたときに意味のある数値となります。

また、量的データは、データの数値の連続性の有無という観点によって、連続データ(取りうる値に隙間がなく連続になっている値)と離散データ(取りうる値がとびとびになっている値)に分けられます。

身長などの連続型データでも、計測したデータは有効数字の関係からとびとびの値になります(離散型のデータになりうる)。しかし、目盛りが非常に細かく、取り得る値が多くなるデータであるため、連続データとして扱います。


質的データ

類別するために数値を与えられたデータです。

名義尺度(区別だけをする尺度)または順序尺度(区別に順序がつく尺度)によって計測されます。データ間の大小比較や演算をしても無意味で、ここでの数値は単なる分類の意味しか持ちません 。