DataFrameの列の抽出

PandasのDataFrameより、列を抽出する方法は2種類ある。

import pandas as pd
import numpy as np

# 任意のDataFramを作る
df=pd.DataFrame(
{‘name1’:[‘a’,’b’,’c’,’d’,’e’],
‘name2′[‘one’,’two’,’three’,’for’,’five’],
‘data1’:np.random.randn(5),
‘data2’:np.random.randn(5)}
)

df


#抽出方法、その1
df1=df[[‘name1′,’data1’]]
df1

#抽出方法、その2
df2=pd.DataFrame(df,columns=[‘name1′,’data1’])
df2

#その1、その2ともに同じアウトプットとなる

matplotlibとpandasの描写の使い分け

pythonの代表的なライブラリー、matplotlibとpandasは、いずれもグラフを描写できる。両者の使い分けについて混乱していたけれど、ようやく整理できかけている〜

1)基本はmatplotlibで描く
2)Series、DataFrameで作成した数値の表を利用したい場合(あるいはウェッブからのスクレイピングや、Excelで作成されたファイルを読み込む場合)は、pandasで描写する。その際に、matplotlibのオブジェクトを引数に入れることもあり、このへんが、とくに、ややこしい)