ウェッブ上の表を再構築

ウェッブサイトのいくつかあるテーブルから、最初のテーブルのインデックスと値だけを抽出して、Anaconda上で、またテーブルを組み立てる。

reモジュールのメソッドの引数に、正規表現を記述しようと思ってはみたけれど、正規表現に不慣れ、というか、使ったこともないため、エラいことになっていた。

暗中模索のなか、pandasを使ったところ、カンタンに出来てしまった。なーんだ、である。

import pandas as pd
url = 'https://bellcurve.jp/statistics/course/18766.html'
dfs = pd.read_html(url)

print(dfs[0])

# アウトプット
性別   度数
0  オス   60
1  メス   40
2  合計  100

(追記)
もっと、カンタンな方法があった。pandas、すげぇわ。
ウェッブサイト上の任意のテーブルをコピーし、以下の記述。これだけ〜

dfs2=table= pd.read_clipboard()
print(dfs2)

# アウトプット
性別   度数
0  オス   60
1  メス   40
2  合計  100

気づいたことを、お気軽に。
公開まで、やや時間がかかりまーす!