レバリッジ

ホリエモンの本はよく読んでいる。

「考えたら負け」の中では、レバレッジをすすめている。

レバレッジとは、他人の資本で利益を出すことだと思うけれど、ま、それはさておき、

いま規模が0.5だけれど、対前年比10%の職業と、いまは1だけれど対前年比-10%の職業を比較してみよう。

pythonでコードを書いてみる。

import numpy as np
t=np.arange(1,10.1,0.1)
y1=0.5*1.1**t
y2=1-(0.1*t)
import matplotlib.pyplot as plt
plt.plot(t,y1)
plt.plot(t,y2)
plt.grid()

 




3年すぎると、0.5の方の職業が逆転してしまうという。それ以降は、ご覧のとおりなのだ。

「訓練」と「テスト」

機械学習の「訓練」と「テスト」は、チュートリアル通りに打ち込めば、そのままできてしまう。

いったい、なにをやっているのか、わからない人も多いのではないだろうか。少なくとも、ぼくは、そうなのだが、

ただ、きのう、フとひらめいたりした。

こういうことじゃ、ないのかねぇ。

機械学習の チュートリアルではデータセットをつかう。

そのさい、コードを打ち込めば、データは「訓練用)、「テスト用」にランダムに分けられる。

「訓練用」のデータども(教師データ)は、(ステップ関数やシグモイド関数など)選んだ関数により、目的関数に合ったパラメータが作られる。

そして「テスト用」のデータでは、その関数と、そのパラメータで、目的変数と、どれくらい一致するか、確かめられる。確率が小さい場合は、関数を変えたりして、再度「学習」「テスト」してみる。

…書いているうちに、怪しい理解のような気がしてきたかもです。間違いのご指摘、大歓迎ですー。

音声認識ソフト

ユーチューブなどで記者会見の様子を見ていると、記者たちが一心不乱にキーボードを打っている。

アメリカは、どうでしょう。

推測では、そういう風景は、目に付かないんじゃない?

文化的な背景の違いなど、分かりやしない。ただ、それ以前に、英語圏では、音声を文字に起こすソフトが充実している。

この分野は、グーグルでしょ。そうおもっていた。がしかし、Otterというソフトの評価が高く、あちらのライターにとって、手放せないものになっているらしい。

音声をAIで対応させるには、それに携わる技術者の力量が問われるだろう。ただ、それだけではなく、学習/訓練させるためのデータの量も問われてくるらしいんだわ。

世界を俯瞰してみれば、日本語のデータ量は、国内で思っている以上に少ない。一方の英語のデータ量は比べものにならないほど多い。あ、それから中国語も多いね。AIによる音声認識がアメリカと中国で進んでいるのも、収集できるデータ量の大きさによる、と言っても言い過ぎではないでしょう。

この文章のはじめに、日本の記者の記者会見の際のキーボードを打つ姿を、やや批判的に書いたけれど、ICレコーダで取材を録音→オフィスに帰ってからのテープ起こしと比べると、まだ、ましである。やれやれ。優秀な音声認識ソフトが待ち遠しい。