データに関して、Excelをやり過ごし、pythonでやっている。
なので、じっさいはExcelとpython、どちらが便利なのか、スッキリしない。
ただし、間違いなく、データの打ち込みは(セルに打ち込める)Excelのほうが便利だ。
チェックしてみると、Excelには、あらかじめ関数が用意されている。
使いこなしている人は、これも便利にちがいない。
きょう、Excelの所与の関数では、できない事がらを発見した。
Excelでは、多くの値があり、それぞれ重複する個数を一覧させることができないんだわ。
やるなら、マクロを自分で書く必要がある。
そうなると、個人的にはpythonでやる、と、まぁ、こうなるわけだ。
以下、「三体」を読み終え、メルカリに出品するために、同小説がどのくらいで出品されているか、感じをつかむために書いたコードとなる。
import pandas as pd
# エクセルに打ち込んだ値を読み込む。
df=pd.read_excel('three_body.xlsx')
#データ数は275個。最初の5つだけを表示させる
df.head()
#数値(price)の値の、それぞれの個数を一覧する
df=df.groupby('price')['price'].count()
#スペースの都合上10個のみ表示させる
df.head(10)
#グラフ化する
fig=plt.figure(figsize=(25,6))
ax=fig.subplots()
df.plot.bar(ax=ax)
plt.show()
#平均値
avg=df.mean()
print(avg)
3426.407273
#中央値
md=df.median()
print(md)
3450.0
#最頻値
mode=df.mode()
print(mode)
3300