こんにちは。相城です。箱ひげ図につて書いておこうと思います。
ヒストグラムは分布の形が分かりやすいのに対して, 箱ひげ図は, 中央値などが視覚的にわかるように工夫されており, 分布の広がりをわかりやすく表しています。したがって, 2つ以上のデータを比べるに役立ちます。
箱ひげ図
箱ひげ図は, 分布の広がりをわかりやすく表したもので, 以下のように書きます。


データの範囲は(最大値)-(最小値)で求まります。
四分位範囲は(第3四分位数)-(第1四分位数)で求まります。
四分位数の求め方
①データを小さい順に並べる。
②まず中央値(第2四分位数)を決める。
③中央値を境にデータを前半と後半に分けて, 第1四分位数(前半の中央値)・第3四分位数(後半の中央値)を決める。
②まず中央値(第2四分位数)を決める。
③中央値を境にデータを前半と後半に分けて, 第1四分位数(前半の中央値)・第3四分位数(後半の中央値)を決める。
具体的に描いてみる
具体的に描いてみます。
次のデータがあるとします。
1, 2, 3, 4, 5, 7, 9, 11, 12, 13, 15, 16, 17
このデータの中央値9
第1四分位数は
第3四分位数は
最小値は1, 最大値は17なので, 箱ひげ図は以下のようになります。

このデータからデータの範囲は, 四分位範囲は
とわかります。
データの大体の割合
また, データの分布の割合を見ると最小値からまでは全体の約
(約25
),
~
も全体の約
(約25
),
~
も全体の約
(約25
),
~最大値も全体の約
(約25
)に構成されています。

したがって, 9以上のデータは全体の約50になります。
散らばり具合が確認できる
箱ひげ図にするとデータの散らばり具合が比較できます。以下の例を見ていきましょう。

AとBを比較すると最小値から最大値までの長さがほぼ同じです。この場合, AとBのデータの散らばり具合はほぼ同じです。CとDを同じように比較すると, Cの方がデータの散らばり具合が大きいことが分かります。