行、列の途中のNaNの削除

ExcelからPandasに読み込むばあい、NaN(欠損値)の処理に手間取ってしまう。

きのうのブログでは、NaNが一列、一行の場合の処理の方法を書いてみた。

NaNが一列、一行の途中にある場合、どう処理したら良いだろう。

このへんは、だいぶ、なやましい。

まずはExcelのデータを作ってみた。



以下、Jupyter Notebook。

ExcelのデータをPandasで読み込む。

import pandas as pd
table=pd.read_excel(‘fullna.xlsx’)
table


table.dropna(how=’all’).dropna(how=’all’,axis=1)

一列、一行のNaNが削除された。



table.fillna(0)



table.fillna(”)