ソースコードはこちら。変更点やよくあるエラーの対処法なども載せています。
→https://zenn.dev/dijzpeb/books/6bb4672104889fc17829?utm_source=youtube&utm_medium=social&utm_campaign=main_7

【メンバーシップ】
入会して頂くと、動画の内容についての質問など、優先的に対応します!
https://www.youtube.com/channel/UCDzwXAWu1zIfJuPTTZyWthw/join

競馬予想AIシリーズ第7回。スクレイピングで必ず覚えておきたいテクニックとは・・・?
0:00 今回やること
1:31 BeautifulSoupで馬ID、騎手ID一覧をスクレイピングする方法
19:40 過去成績データをスクレイピング

【他の動画】
次の動画:過去成績データを使うデータに結合する

人気の動画:「Pythonで競馬データをスクレイピングする」

前回の動画:「ランダムフォレスト・勾配ブースティング木で競馬予想をする」

【追記】
一部の馬について、pd.read_html(url)[3]だと受賞歴のデータが取り出されてしまうことがわかりました。そのため、
df = pd.read_html(url)[3]
if df.columns[0]==’受賞歴’:
  df = pd.read_html(url)[4]
などとして、受賞歴がある馬については4番目のDataFrameを取り出すようにしてください。

【プロフィール】
2019年:東京大学理学部物理学科卒業
現在:東京大学理学系研究科物理学専攻 修士2年
2021年:マーケティングのデータ分析をする会社に就職予定

【メールアドレス】
dijzpeb2@gmail.com

質問・要望などあれば、ぜひコメントしてください!

WACOCA: People, Life, Style.