帰納に比重が移っていく

これからは、情報空間はますます広がっていく。

信用の質も変わっていく。

そして、もうひとつ気づいている点がある。

きのう演繹と帰納について書いた。

きょうは、「演繹から帰納に視点の比重が移ってきているかも知れない」という話に触れたい。

機械学習(AI)は、日を追って、そのアプリケーションが充実してきている。

Gメールのスパムの排除、(文字キーワードだけでなく)画像による検索、そして自動の文字起こしや翻訳など、そのアプリケーションは様々だ。

余談になるが、いままで、文字起こしや文字の読み上げ、自動翻訳はワンフレーズごと、といった感じだった。

しかしGoogle Assistantなら、今年中に、連続する発話に対応できるようになる。

当面、Android対応だが、その後、iPhone版も出るかもしれない。

この種の機械学習のカテゴリーは、たぶん、「推測」と「分類」に大別される。

これ、間違っているかも、ですけれど…

機械学習では、所与のデータが与えられ…それに適応するアルゴリズムや関数により、データが学習/訓練され(モデル化され)…あらたにインプットされるデータに対して「推測」「分類」がなされている…こんな感じだとおもう。

で(説明が、まだ、こなれていないけれど)機械学習は、いっそ帰納的と言っても良いのでは、と言ってしまいたいんだね、俺は。

「統計学は最強の学問である」という本は、とても興味深い。

著者は、機械学習を統計学の延長として位置づけている。

本書を読むと、統計というのも、演繹よりむしろ帰納的な印象を持つ。

いずれにせよ、機械学習も統計も、これからの最重要科目になっていくでしょう。

そもそも演繹、すなわち原因→結果というのは、個人のバイアスが大きくかかってしまっている。

(このへんは「ファスト&スロー」(ダニエル・カーネマン)に大いに啓蒙された)

みんながダマになって、同じというなら、演繹は有効かもしれないけれど、バラバラになっている現在、そして、なっていく将来、帰納の方が有用だとおもったりしているわけネ。

ランダム

あなたは、4ケタの数字を書きつらねてみよう。

1568、3248、2156….

なにげに書いていても、あなたの前に書く数字に影響を受けて、次の数字を書いている。

ピアノの音はカンナの赤の色と。

このような象徴的なことばに触れさえしても、ことばは、あなたの行動に影響を与えている。

「ファスト&スロー」(ダニエル・カーネマン)によると、このような効果は、やや専門的なことばで、「プライミング効果」と呼ばれているそうだ。

オッケー、数字のはなしに戻ろう。

あなた一人で数字を書き連ねたばあい「プライミング効果」によりバイアスがかかってしまう。

ならば、多くのひとが数字を書いて、それを集めたら、どうだろう。いいアイデアかもしれない。

しかし、その集団がなにか関わりのあるひとの集まりなら、やはり、そこにはバイアスが生じてしまう。このアイデアを実行する前にワイワイ会話などしたら、なおさらだ。

そもそも、データを集めるばあい、属性に関係なく、できる限り多くのデータを収集した方が有効だ。

なので、世界中のひとの検索キーワードを収集するグーグルや、世界中の買い物のデータを集めるアマゾンは、有利なわけだね、たぶん。

ちなみに個人でランダムの数字を得ようとするばあい、じぶんで、そのようなプログラミングを書いたり、それが面倒なら、既存のライブラリー(pythonならrandomなど)をつかえば、簡単にできてしまう。