対数の描画

対数を描いてみる。

pythonのグラフを描くライブラリーであるmatplotlibには、logオブジェクトが用意されている。

それを使ってみた。がしかし、底の引数には2と10しか使えないようだ。

底の数を幅広く使えるようにするには、かんたんな関数を入れてみると、オッケーだったりする〜

/* python */

import numpy as np
import matplotlib.pyplot as plt

def logarithm(x,base):
    return np.log(x)/np.log(base)  //底の変換公式を使う

x= np.arange(5,100,0.01)
y05=logarithm(x,1/2)
y2=logarithm(x,2)
y10=logarithm(x,10)

p1,=plt.plot(x,y05) 
p2,=plt.plot(x,y2)
p3,=plt.plot(x,y10)
plt.legend([p1,p2,p3],["logx1/2","logx2","logx10"])
//対数の名前を明示する
plt.grid() //グリッドを付ける
plt.show()

 

渋沢栄一の「論語講義」

「論語」を読み返すことがある。

同書は解説者により、多々、解釈が異なる。

個人的には、渋沢栄一の解説で読んでいる(「論語講義」/ 講談社)

ウィキペディアによると、明治維新の始まりには諸説あるようだ。

狭義では、明治改元にあたる1868年となっている。

がしかし、一般的には、その前年の1867年に行われた大政奉還、王政復古を、明治維新の始まりとすることが多いらしい。

夏目漱石は、1867年に生まれた。いずれにせよ、幼少のころが明治維新であった、と言えるだろう。

ちなみに森鴎外は1862年生まれ。漱石より5つ年上、と言うことになる。

一方の渋沢栄一は1840年生まれ。漱石より27年も年上となる。

司馬遼太郎によると、漱石は現在に通じる文体を作った人、ということになっている。

小説、随筆、新聞記事に至るまでの汎用性の高い文体となっているらしい。

残念ながら、それについては確かめる時間も能力もないけれど、少なくとも、漱石の文章は、現在でも読める文章だと思う。

それに比べると、「論語」を解説した渋沢栄一の文章は読みづらいし(実際には渋沢の言ったことが文章化されているのだけれど)
意味の分からないところも、ずいぶんある。

たとえば漢字ひとつの解釈も、現在とはニュアンスが違ったりもしている。

メルカリやクラウドワークス

インターネット上のプラットフォームは、可能なかぎり、ためすようにしている。

げんざいはメルカリと、クラウドワークスをやっている。

すくなくとも両者について、当事者二者の条件は「非対称」になっている、とおもう。

ここでいう「非対称」というのは、

メルカリなら、売り手の方が買い手よりコスト(気遣いや手間)がかかるし、

クラウドワークスの方は、仕事を受注する方が、発注する側よりコストが、かかる。

なので、メルカリなら「買う」を、クラウドワークスなら「発注する」の方を、おすすめしたい。

それと、もうひとつ。

メルカリもクラウドワークスも、知らない同士の取引をサポートするプラットフォームなので、それに合った設計となっている。

たとえばメルカリなら、一度、取り引きが成立した後は、条件の変更は、一切不可となっている。

ま、これは当たり前で、取り引き成立後、商品売買の内容を変えることができたら、悪だくみをする輩(やから)が、まったく出てこない、ということもないだろう。

ただし、ちゃんとした事情があって、取引成立後、条件を変えたいケースもある。じつはオレが、そうだったわけ。

そのばあい、
1)まずは、メッセージで相手に事情を伝え、納得してもらい…おたがいが取引をキャンセルする。
2)そのうえで、あらたな条件のもとで、出品者は異なる条件で同じ商品をアップし、同じ買い手に(ほかの人に落札されないうちに)速攻で購入する、という手順になる(ユーザーを指定して落札していただく方法もあり、というハナシも聞いているけれど、たしかめていない)

このさき、この種の取引にはブロックチェーンが取り入れられていくでしょう。

ブロックチェーンは、まだ、そのアプリケーションに厚みがないわけで。ゆいいつ、知られているのは暗号資産(仮想通貨)なんだよなぁ。

二項分布

10円玉を投げたとき、表が出たり、裏が出たりする。

その際の確率変数を、表を1、裏を0とする。

P(X=1) = P
p(X=0) =1-P

n回投げたとき、表が出る確率を描く分布を二項分布というらしい。

関数は以下の通り。うーん、むつかしい。

具体的にやってみよう。

3回投げたとき、3回とも表が出る場合、


(10×9×8 / 3×2×1) ×(0.5×0.5×0.5×0.5)×(0.5×0.5×0.5×0.5×0.5×0.5×0.5) 
=120 × 0.125 × 0.0078125
=0.1171875

計算がたいへん、

というわけで、pythonのライブラリーをつかって、やってみる。

ライブラリーscipyをつかう。
from scipy.special import comb

comb=comb(10,3)
Pa=(1/2)**3
Pb=(1/2)**7
ans = comb*Pa*Pb
0.1171875

ライブラリーをつかえばカンタンにできてしまうが、そのクラスやアトリビュートは、ぜったい覚えられないだろうよ。

じゃ、コイン10回投げたとき、表が出る回数の確率を求めてみよー。

from scipy.stats import binom

n = 10
p = 1/2
x=range(n+1)
y = binom.pmf(x,n,p)
y

array([0.00097656, 0.00976563, 0.04394531, 0.1171875 , 0.20507813,
       0.24609375, 0.20507813, 0.1171875 , 0.04394531, 0.00976563,
       0.00097656])

 プロットする。
import matplotlib.pyplot as plt
plt.plot(x,y,’o’)

10回中、5回投げた場合、いちばん表が出る確率が高いことが分かる。このへんは直感どおりだねぇ。0.25%というのが、ちょっと…0.5%の方が俺的にはピンと来たりするけれど…

参考:
実践python データサイエンス/udemy
13-1二項分布 統計WEB
 

離散型確率分布

定数は1、のように定まった数値。

変わる数値は変数という。

たとえば、サイコロを振ってみよう。

その際の変数をXとする。

Xは、ときには1になり、ときには2になり….6となる。

そして確率っぽく利用するときは、確率変数と呼ばれ、X=1,2,3,4,5,6となる。

オッケー、ここからpythonで、カンタンなプログラムを書いてみよう〜

まずライブラリーを読み込む。
from numpy.random import randint
from scipy import stats
import matplotlib.pyplot as plt

確率変数をリスト化する。
dice_random_variable = [1,2,3,4,5,6]

1〜6までの確率(1/6)の合計(1/6+1/6+1/6+1/6+1/6+1/6=1)
prob_sum = 1

それぞれの目が出る確率。
prob = prob_sum/len(dice_random_variable)
prob
0.16666666666666666

棒グラフで表現してみる。
plt.bar(dice_random_variable,prob)




平均値(期待値)を求める。



mean=sum(dice_random_variable )*prob
mean
3.5

分散を求める。



var=((mean-1)**2+(mean-2)**2+(mean-3)**2+(mean-4)**2+(mean-5)**2+(mean-6)**2)*prob
var
2.9166666666666665


参考:

実践python データサイエンス
11-2 離散型確率分布と確率質量変数 / 統計WEB
標準偏差/ウィキペディア

 

アプリケーション

よく、アプリケーションというコトバをつかいたくなる。

スマホでは、アプリケーションは、呼びやすいように、そして親しみやすいように、短く、アプリと呼ばれたりもする。

後で、辞書で、その意味を調べてみるけれど、じぶんがアプリケーションというコトバをつかうばあいは、なにも、スマホやコンピュータだけでなく、たとえば、こんなかんじだ。

電気が電線をつたって家庭まで来ている。その先に、クーラー、洗濯機、冷蔵庫がつながっている。

そのさいの、それぞれのアプリケーションは「部屋を冷やすこと」「衣類を洗うこと」「食品を長持ちさせること」となる。

2010年前後は画期的なツールが、開発されたとおもっている。

ディープラーニング、ブロックチェーン、クリスパー9だ。

それぞれのアプリケーションは、たとえば、自動運転、仮想通貨、ゲノム編集となったりする(ゲノム編集については

このさい、アプリケーションの意味を辞書で調べておこうか。

the pratical purpose for which a matchine,idea etc can be used,or a situation when this is used.
(LOMGMAN/iphoneのアプリより)

for文 / python

for i in range(6):
print(i)
print(‘Hello World’)

0
Hellow World
1
Hellow World
2
Hellow World
3
Hellow World
4
Hellow World
5
Hellow World

for文の基本的な書き方だ。
でも、これでさえ、理解がしっくりいかない。
これに対しては(間違っているかもの)補助線を引いて、
in rangeはブロック内の関数が実行される回数で、0,1,2,3,4,5は、それに対する添字というふうに、このさい、思ってしまおう。

for文とappend()関数の使い方は、こんなかんじ。

external_list=[]
for i in range(1,6):
external_list.append(i)

external_list

[1, 2, 3, 4, 5]

取材について

きのう、「統計学が最強の学問である」という書籍について触れた。

オレでさえ、再読することで、だいぶ理解できる良書だとおもう。

ただし、続編となる「実践編」や「数学編」はお手上げだ。

後者を読むには、基礎的な数学や統計の知識が必要だ。

「教科書を読めない子どもたち」という本が話題になったそうな。

きのう、たまたまネットで、教科書を読めない子どもたちが、本書を読む場合、じぶんで分かるところだけつなげて理解するという記事を読んだ。

これって、なにも子どもに限ったことであるはずが、ない。

オレだって分からないものを無理やり理解しようとすれば、そうなってしまう。

先に触れた統計学の続編の書籍を読んだときも、そんな感触だわ。

前置きが長くなってしまった。取材について書いてみたかったんだ。

取材の仕事を受けても、じつは、取材者はその対象について理解してはいない。

おうおうにして、子どもたちが自分で分かるところだけ、つなげて理解するのと同様な状態となってしまう。

それでも仕事が成立していたのは、媒体、というとむつかしい言い方だね、要は新聞、雑誌、パンフレットという媒体が当然のようにあったから、なんだわ。

その存在の、おすそ分けにより(そこに載ることが前提になっているおかげで)理解できてなくても、フツーにカバーできていたわけネ。

たとえば、読売新聞の記事広告に載せることが決まっていることにより、取材者の理解云々には、目が行くことは、ない、と言ってしまおう。

インターネットは、ただのプロトコルだけれど、そのアプリケーションであるウェッブ、そしてSNSは、とても大きな影響を与えている。

ウェッブ誕生から25年たって、ようやく保守的な、政治や、医療・教育などにも影響を振るうようになった。

けれど、いちばん、真っ先に影響を受けたのは広告や出版なんだぜ。

影響どころか、打撃と言ってもいい。

打撃というと、その方向はマイナスを示すけれど、良いこともある。

それは、寄れば大樹の媒体に頼れなくなった取材者の無知が、無効になってしまったことだ。

それについて、考えてもいるけれど、きょうは、ここまでね〜

不確かさについて

従来の、空気のように普通だと思っていた基準が不確かになってきている。その結果、一方では「好き」「嫌い」を基準に、それが増幅され、たとえば、現在の日韓関係の深刻さとして表出させている。自由や民主主義は普遍的ではないでしょう。理念を持ち続けてきたことで、保たれてきたんだと思う。本来は、「好き」「嫌い」で相手をやっつけてしまうような、荒々しいものだと、言えなくもない、と思う。

「ショック・ドクトリン」というナオミ・クラインの書籍がある。ずいんぶん前に読んだので、記憶が不確かだけれど…アメリカの政策を立案する、あるグループが、混乱している南米や東欧のある地域をさらに混乱させ、カオス状態にさせた上で、自分たちのアイデアが社会にどう実現するかどうか確かめ…そして、その結果を踏まえて自国にも、そのアイデアを入れていこうとした…そういうことが書かれていたと思う。アメリカを更地にした上で、まったく新しくするといった当初のトランプの政策立案者のバノン(だっけ?)の発言は、この「ショック・ドクトリン」という書籍を思い出させる。

以前より感情的になっている一方で、本来専門的な内容である統計やファクトフルネスの書籍が売れている。

「統計学が最強の学問である」という書籍は、ベストセラーになった。

それだけ統計が一般の需要に応えたとも言えるし、それだけでなく、本書が統計という数式や図式の世界を、分かりやすい言葉を中心に書き切ったという点が、広く読まれた要因になっていると思う。