機械学習の「訓練」と「テスト」は、チュートリアル通りに打ち込めば、そのままできてしまう。
いったい、なにをやっているのか、わからない人も多いのではないだろうか。少なくとも、ぼくは、そうなのだが、
ただ、きのう、フとひらめいたりした。
こういうことじゃ、ないのかねぇ。
機械学習の チュートリアルではデータセットをつかう。
そのさい、コードを打ち込めば、データは「訓練用)、「テスト用」にランダムに分けられる。
「訓練用」のデータども(教師データ)は、(ステップ関数やシグモイド関数など)選んだ関数により、目的関数に合ったパラメータが作られる。
そして「テスト用」のデータでは、その関数と、そのパラメータで、目的変数と、どれくらい一致するか、確かめられる。確率が小さい場合は、関数を変えたりして、再度「学習」「テスト」してみる。
…書いているうちに、怪しい理解のような気がしてきたかもです。間違いのご指摘、大歓迎ですー。