高校数学:分散と標準偏差などのお話


こんにちは。相城です。今回は分散と標準偏差のお話です。

偏差とは

偏差は, 一言でいえば平均との差の値です。
データx_1, x_2, x_3, \cdots, x_nの平均値を\overline{x}とするとき,
x_1-\overline{x}, x_2-\overline{x}, x_3-\overline{x},\cdots, x_n-\overline{x}
を平均値からの偏差といいます。

分散s^2

分散とはデータの散らばり度合いを表す値です。偏差ではデータと平均の違いを求めると正の数だったり, 負の数だったりするので, 平均との違いが+100あったとしても, もう一方で平均との違いが-100なら, そのまま加えると, 見かけ上, 違いが0になってしまいます。それでは都合が悪いので, 偏差を2乗して正負の符号を取りはらって計算します。
ですから, 分散s^2は, 偏差の2乗の平均値になります。したがって
s^2=\dfrac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+(x_3-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}
で求められます。
ちなみに, 平均をとるのは, 標本数が違っても対比できるようにするためです。
偏差が平均との差を表しているので,この値が小さければ平均に近い値が多く, 大きければ平均との差が大きい値のものが多いことになります。

また, 分散s^2の右辺を展開していくと,
s^2=\dfrac{1}{n}\{({x_1}^2+{x_2}^2+\cdots+{x_n}^2)-2\overline{x}(x_1+x_2+\cdots+x_n)+n{\overline{x}}^2\}
=\dfrac{1}{n}({x_1}^2+{x_2}^2+\cdots+{x_n}^2)-2\overline{x}\cdot\underline{\dfrac{1}{n}(x_1+x_2+\cdots+x_n)}+{\overline{x}}^2
={\overline{x^2}}-\overline{x}^2
※下線部は\overline{x}と同値
としても分散は求められます。

標準偏差s

標準偏差sは分散の正の平方根であるから, 標準偏差の意味は分散と同じで, データの散らばり度合いを表します。分散はデータを2乗しているので, 例えばデータが長さ(単位m)なら, 2乗するので単位が面積の単位(m^2)になってしまいます。それではちょっと都合が悪いので, 単位を元に戻す意味で, 分散の正の平方根をデータの散らばり度合いとして, 標準偏差を一般的に用います。
s=\sqrt{\dfrac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+(x_3-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}}
または,
s=\sqrt{{\overline{x^2}}-\overline{x}^2}

具体的にやってみよう

5人のテスト結果1
45, 65, 60, 95, 85
平均\overline{x}
\overline{x}=\dfrac{1}{5}(45+65+60+95+85)=70
分散s^2
s^2=\dfrac{1}{5}\{(45-70)^2+(65-70)^2+(60-70)^2+(95-70)^2+(85-70)^2\}
=\dfrac{1}{5}\cdot1600
=320
もう一つの分散の公式を用いて求めてみると,
\overline{x^2}=\dfrac{1}{5}(45^2+65^2+60^2+95^2+85^2)
=\dfrac{1}{5}\cdot26100
=5220
s^2=\overline{x^2}-\overline{x}^2
=5220-70^2
=320
同じになりましたね。
したがって, 標準偏差sは,
s=\sqrt{320}\fallingdotseq17.89

因みに点数にばらつきがないように設定してみると
5人のテスト結果2
70, 70, 65, 70, 75
の場合, 結果だけ示すと
平均\overline{x}=70
分散s^2=10
標準偏差s=\sqrt{10}=3.16
テスト結果1より分散, 標準偏差の値は小さくなっています。
このことは, テスト結果2のほうがテスト結果1に比べ, 平均点に近い点数が多く, ばらつきが少ないことを意味しています。

偏差値の計算

偏差値を求めてみよう
偏差値は平均との差に10をかけて, 標準偏差で割り, 50を足せば求まります。はじめに記したテスト結果1の5人の偏差値は以下です。
(45-70)\times10\div\sqrt{320}+50\fallingdotseq36.02
(65-70)\times10\div\sqrt{320}+50\fallingdotseq47.20
(60-70)\times10\div\sqrt{320}+50\fallingdotseq44.41
(95-70)\times10\div\sqrt{320}+50\fallingdotseq63.98
(85-70)\times10\div\sqrt{320}+50\fallingdotseq58.39
平均との差なので, 平均点と同じであれば偏差値はちょうど50になりますね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)