データの基本的特徴を表す「基本統計量」のなかで、データの標準をひとことで示す数値として「代表値(average)」があります。主な代表値は最頻値、中央値、平均の3つです。
目次
最もデータ数が多い値。
度数分布表・ヒストグラムの場合は最も度数の大きい階級値。
定性的には「データの多くはこのあたり、ということを示す値」です。
【特徴】
◯ 極端に大きいまたは小さいデータ(外れ値)が含まれていても影響を受けにくい。
✕ データの数が少ない場合、最頻値の度数が小さいまたは最頻値がいくつも出現するため、代表値としての意味をなさない。
Excel関数 : mode(x1, x2, x3, …)
データを小さい順から並べたときに、真ん中にくる値。
四分位点、パーセント点と同様に、分布のなかの位置を示す。
【特徴】
◯ 極端に大きいまたは小さいデータ(外れ値)が含まれていても影響を受けにくい。
✕ データが変わるとその中でのばらつき方も変わるので、異なるデータどうしでの比較には中央値は適さない。
Excel関数 : median(x1, x2, x3, …)
算術平均(相加平均): arithmetic mean
全テータを足してデータ数で割った値。最もよく用いられる代表値。一般用語でも使われる、いわゆる「平均」。
\(\normalsize\frac{1}{n} \scriptsize\sum x_i \)
\( \tiny n\): データの数(サイズ)
【特徴】
もっともよく使われる平均。
◯ 全てのデータを反映する値になっている。
✕ 極端に大きいまたは小さいデータ(外れ値)の影響を受けやすい。
Excel関数:average(x1, x2, x3, …)
幾何平均 (相乗平均):
掛け算に関わる指標の平均 ( 経時変化における変化率の平均など )
\(\scriptsize\sqrt[n]{x_1\cdot x_2\cdot \cdot \cdot x_n}\)
Excel関数:geomean(x1, x2, x3, …)
加重平均:
重み付けをして平均する場合
Excel関数:
sumproduct( データの列(行) , 重み付けの列(行) ) / sum( データの列(行) ))