ウェッブサイトのいくつかあるテーブルから、最初のテーブルのインデックスと値だけを抽出して、Anaconda上で、またテーブルを組み立てる。
reモジュールのメソッドの引数に、正規表現を記述しようと思ってはみたけれど、正規表現に不慣れ、というか、使ったこともないため、エラいことになっていた。
暗中模索のなか、pandasを使ったところ、カンタンに出来てしまった。なーんだ、である。
import pandas as pd
url = 'https://bellcurve.jp/statistics/course/18766.html'
dfs = pd.read_html(url)
print(dfs[0])
# アウトプット
性別 度数
0 オス 60
1 メス 40
2 合計 100
(追記)
もっと、カンタンな方法があった。pandas、すげぇわ。
ウェッブサイト上の任意のテーブルをコピーし、以下の記述。これだけ〜
dfs2=table= pd.read_clipboard()
print(dfs2)
# アウトプット
性別 度数
0 オス 60
1 メス 40
2 合計 100