ソースコードはこちら。変更点やよくあるエラーの対処法なども載せています。
→https://zenn.dev/dijzpeb/books/6bb4672104889fc17829?utm_source=youtube&utm_medium=social&utm_campaign=main_7
【メンバーシップ】
入会して頂くと、動画の内容についての質問など、優先的に対応します!
https://www.youtube.com/channel/UCDzwXAWu1zIfJuPTTZyWthw/join
競馬予想AIシリーズ第7回。スクレイピングで必ず覚えておきたいテクニックとは・・・?
0:00 今回やること
1:31 BeautifulSoupで馬ID、騎手ID一覧をスクレイピングする方法
19:40 過去成績データをスクレイピング
【他の動画】
次の動画:過去成績データを使うデータに結合する
人気の動画:「Pythonで競馬データをスクレイピングする」
前回の動画:「ランダムフォレスト・勾配ブースティング木で競馬予想をする」
【追記】
一部の馬について、pd.read_html(url)[3]だと受賞歴のデータが取り出されてしまうことがわかりました。そのため、
df = pd.read_html(url)[3]
if df.columns[0]==’受賞歴’:
df = pd.read_html(url)[4]
などとして、受賞歴がある馬については4番目のDataFrameを取り出すようにしてください。
【プロフィール】
2019年:東京大学理学部物理学科卒業
現在:東京大学理学系研究科物理学専攻 修士2年
2021年:マーケティングのデータ分析をする会社に就職予定
【メールアドレス】
dijzpeb2@gmail.com
質問・要望などあれば、ぜひコメントしてください!

WACOCA: People, Life, Style.