「数ⅡBくらいの知識があれば、機械学習は理解できる」という意見がある。
ただ、それは、かなり理解している人からの意見であって。ビギナーにとって、なかなか、そうはいかない。
そして個人的には、高校の数学よりむしろ、統計の方に、とまどったりしている。
統計は、教わらなかったんだネ、たぶん。
基礎的なことから、すでに、わからない。
とりあえず、標準偏差について、まとめておく。
標準偏差とは、データの散らばり度合いを示す値。データの散らばりが大きいと標準偏差は大きくなり、逆に散らばりが小さいと標準偏差はゼロに近づく。
<<標準偏差の求め方>>
Aさん 71点
Bさん 80点
Cさん 89点
1)平均値を求める
平均値 = (71+80+89)/3 = 240/3 = 80
2)偏差を求める => それぞれの平均値との差
偏差
Aさん 71−80 =-9
Bさん 80−80 = 0
Cさん 89−80 = 9
3)分散を求める =>分散は偏差の2乗の平均
分散 = {(-9)^2+0^2+9^2}/3 = 54
4)標準偏差 => 分散の平方根
標準偏差 = √54 = 3√6 ≒ 7.35
この例題では、データがたった3つだけれど、データ数が増えれば、
平均値+標準偏差 = 80+7.35=87.35
平均値-標準偏差 = 80-7.34=72.65
72.65〜87.35の間の数は68%の確率を示す。
さらに、
平均値+(標準偏差×2) = 80+14.7=94.7
平均値-(標準偏差×2)=80-14.7=65.3
65.3〜94.7の間は95%の確率を示す。