代表値(最頻値・中央値・平均)


データの基本的特徴を表す「基本統計量」のなかで、データの標準をひとことで示す数値として「代表値(average)」があります。主な代表値は最頻値中央値平均の3つです。


目次

 最頻値(モード)

 中央値(メディアン)

 平均(ミーン)


最頻値 mode モード 

最もデータ数が多い値。
度数分布表・ヒストグラムの場合は最も度数の大きい階級値。

定性的には「データの多くはこのあたり、ということを示す値」です。

【特徴】
◯ 極端に大きいまたは小さいデータ(外れ値)が含まれていても影響を受けにくい
✕ データの数が少ない場合、最頻値の度数が小さいまたは最頻値がいくつも出現するため、代表値としての意味をなさない。

 Excel関数 : mode(x1, x2, x3, …)

 

中央値 median メディアン 

データを小さい順から並べたときに、真ん中にくる値。

四分位点、パーセント点と同様に、分布のなかの位置を示す。

【特徴】
◯ 極端に大きいまたは小さいデータ(外れ値)が含まれていても影響を受けにくい
✕ データが変わるとその中でのばらつき方も変わるので、異なるデータどうしでの比較には中央値は適さない

 Excel関数 : median(x1, x2, x3, …)

 

平均 Mean ミーン

算術平均(相加平均): arithmetic mean
全テータを足してデータ数で割った値。最もよく用いられる代表値。一般用語でも使われる、いわゆる「平均」
  \(\normalsize\frac{1}{n} \scriptsize\sum x_i \)
   \( \tiny n\): データの数(サイズ)


【特徴】
もっともよく使われる平均
◯ 全てのデータを反映する値になっている。
✕ 極端に大きいまたは小さいデータ(外れ値)の影響を受けやすい

 Excel関数:average(x1, x2, x3, …)


 

幾何平均 (相乗平均) 
掛け算に関わる指標の平均 ( 経時変化における変化率の平均など )
  \(\scriptsize\sqrt[n]{x_1\cdot x_2\cdot \cdot \cdot x_n}\)

 Excel関数:geomean(x1, x2, x3, …)

 

加重平均:
重み付けをして平均する場合

 Excel関数:
  sumproduct( データの列(行) , 重み付けの列(行) ) / sum( データの列(行) ))