2024年1月7日日曜日

競馬予想がしたい工場派遣社員

この前叔父と競馬に行った結果、競馬予想がしたいなぁと思うようになりました。なのでネット競馬というサイトから過去のレース情報を拾ってくるプログラムを作っています。


大体この手のデータ収集は

  1. webサイトからhtmlを取得
  2. htmlをパーサーで解析
  3. csvやdbなどの形式でデータを保存
といった流れでするのが定石です。今はとりあえずhtmlを取得するだけのプログラムを作っています。


ネット競馬にはこういうレースごとのページがあるのでとりあえずこれを丸っと保存している感じです。





ネット競馬のQ&Aを見る限り、大きな負荷をかけなければスクレイピングしても良さげな文言があるのでデータ取得してもOKっぽいです。サーバーに負荷をかけないように1分あたり2~3ページくらいを限度にやっています。

0 件のコメント:

コメントを投稿