標準偏差

「数ⅡBくらいの知識があれば、機械学習は理解できる」という意見がある。

ただ、それは、かなり理解している人からの意見であって。ビギナーにとって、なかなか、そうはいかない。

そして個人的には、高校の数学よりむしろ、統計の方に、とまどったりしている。

統計は、教わらなかったんだネ、たぶん。

基礎的なことから、すでに、わからない。

とりあえず、標準偏差について、まとめておく。

標準偏差とは、データの散らばり度合いを示す値。データの散らばりが大きいと標準偏差は大きくなり、逆に散らばりが小さいと標準偏差はゼロに近づく。

<<標準偏差の求め方>>

 Aさん  71点
 Bさん  80点
 Cさん  89点

1)平均値を求める

平均値 = (71+80+89)/3 = 240/3 = 80

2)偏差を求める => それぞれの平均値との差

偏差

Aさん  71−80 =-9
Bさん  80−80 = 0
Cさん  89−80 = 9

3)分散を求める =>分散は偏差の2乗の平均

分散 = {(-9)^2+0^2+9^2}/3 = 54

4)標準偏差 => 分散の平方根

標準偏差 = √54 = 3√6 ≒ 7.35

この例題では、データがたった3つだけれど、データ数が増えれば、

平均値+標準偏差 = 80+7.35=87.35
平均値-標準偏差 = 80-7.34=72.65

72.65〜87.35の間の数は68%の確率を示す。

さらに、
平均値+(標準偏差×2) = 80+14.7=94.7
平均値-(標準偏差×2)=80-14.7=65.3
65.3〜94.7の間は95%の確率を示す。

気づいたことを、お気軽に。
公開まで、やや時間がかかりまーす!