【プラス収支達成!】2019年に機械学習(重回帰分析)で競馬予測をかけた結果をまとめました。

【プラス収支達成!】2019年に機械学習(重回帰分析)で競馬予測をかけた結果をまとめました。

【プラス収支達成!】2019年に機械学習(重回帰分析)で競馬予測をかけた結果をまとめました。 では、2019年の3月から実施していた機械学習(重回帰分析)を利用した競馬予測について、実際に行った予測結果のデータを集計してみました。

もうすでに2020年5月を過ぎているので、かなり遅めの集計です。すみません・・・

 

本サイトでは、2019年に機械学習の基本の一つである回帰分析を用いて競馬のタイム予測に挑戦しておりました。

詳細についてはこちらの記事をご参照いただければと思います。

機械学習(重回帰分析)を利用して競馬予測に挑戦します!【過去データからタイムを予測】

2019年3月24日

【数式なしで徹底解説!】機械学習の基本!回帰分析(単回帰分析・重回帰分析)について解説します!

2019年2月24日

G1レースを対象に、分析に必要な過去データが十分に存在していた場合に予測を算出しました。(いくつかやり忘れたのもありますw)

ここでは、実際に予測をかけたレースの結果をまとめて、年単位の成績を算出します。

馬券の買い方によって結果はかなり変わってくるのですが、予測をかけたレースにおいて全て単勝のみを購入した場合だと、トータル収支はプラスになりました!

【プラス収支達成!】2019年に機械学習(重回帰分析)で競馬予測をかけた結果をまとめました。

【プラス収支達成!】2019年に機械学習(重回帰分析)で競馬予測をかけた結果をまとめました。

1. 予測をかけたレース一覧(全9レース)

まずは予測をかけたレース一覧をご紹介します。

全てG1レースが対象で、予測に必要な過去データが十分にある場合にのみ予測を算出しました。

タイムを予測するには過去のレースデータが必要になるので、レース数の少ない新馬のレースにおいては予測を計算することはできません。

予測の流れや条件等についてはこちらの記事をご覧いただければと思います。

機械学習(重回帰分析)を利用して競馬予測に挑戦します!【過去データからタイムを予測】

2019年3月24日

 

そして実際に予測を算出したレース一覧がこちらになります。

全9レースです。

開催日 開催日
2019/03/24 高松宮記念
2019/03/31 大阪杯
2019/04/28 天皇賞(春)
2019/05/12 ヴィクトリアマイル
2019/09/29 スプリンターズS
2019/10/27 天皇賞(秋)
2019/11/17 マイルCS
2019/11/24 ジャパンC
2019/12/22 有馬記念

2. 結果一覧(意外と当たってたw)

お次にそれぞれの結果一覧です。

全く当選がなかったので9レース中4レースです。

その他5レースについては何かしらの当選がありました。

特にリターンが大きかったのが大阪杯のアルアインの単勝です。

もともと人気もあまりなかったので、リターンは2,220円でした。

高松宮記念(2019/03/24)

  • 当選なし

2019/03/24 高松宮記念~機械学習(重回帰分析)による競馬予測~

2019年3月24日

大阪杯(2019/03/31)

  • 単勝: 馬番3, 枠番3, アルアイン –> 2,220円
  • 複勝: 馬番3, 枠番3, アルアイン –> 450円

【1着当選】2019/03/31 大阪杯 ~機械学習(重回帰分析)による競馬のタイム予測~

2019年3月31日

天皇賞(春)(2019/04/28)

  • 当選なし

2019/04/28 天皇賞(春) ~機械学習(重回帰分析)による競馬のタイム予測~

2019年4月28日

ヴィクトリアマイル(2019/05/12)

  • 当選なし

2019/05/12 ヴィクトリアマイル ~機械学習(重回帰分析)による競馬のタイム予測~

2019年5月12日

スプリンターズS(2019/09/29)

  • 単勝 : 馬番: 8, 枠番: 4, 馬名: タワーオブロンドン, 払い戻し: 290円(2人気)
  • 複勝 : 馬番: 8, 枠番: 4, 馬名: タワーオブロンドン, 払い戻し: 130円(2人気)
  • 複勝 : 馬番: 7, 枠番: 4, 馬名: モズスーパーフレア, 払い戻し: 180円(3人気)
  • ワイド : 馬番: 8, 枠番: 4, 馬名: タワーオブロンドン と 馬番: 7, 枠番: 4, 馬名: モズスーパーフレア, 払い戻し: 430円(4人気)

【1着当選】2019/09/29 スプリンターズS ~機械学習(重回帰分析)による競馬のタイム予測~

2019年9月29日

天皇賞(秋)(2019/10/27)

  • 単勝 : 馬番: 2, 枠番: 1, 馬名: アーモンドアイ, 払い戻し: 160円(1人気)
  • 複勝 : 馬番: 2, 枠番: 1, 馬名: アーモンドアイ, 払い戻し: 110円(1人気)
  • 複勝 : 馬番: 5, 枠番: 3, 馬名: アエロリット, 払い戻し: 270円(5人気)
  • ワイド : 馬番: 2, 枠番: 1, 馬名: アーモンドアイ と 馬番: 5, 枠番: 3, 馬名: アエロリット と 馬番: 4, 枠番: 2, 馬名: スワーヴリチャード

【1着当選】2019/10/27 天皇賞(秋) ~機械学習(重回帰分析)による競馬のタイム予測~

2019年10月27日

マイルCS(2019/11/17)

  • 複勝 : 馬番: 5, 枠番: 3, 馬名: インディチャンプ, 払い戻し: 190円(3人気)

2019/11/17 マイルCS ~機械学習(重回帰分析)による競馬のタイム予測~

2019年11月17日

ジャパンC(2019/11/24)

  • 複勝 : 馬番: 2, 枠番: 2, 馬名: ワグネリアン, 払い戻し: 170円(3人気)
  • 複勝 : 馬番: 1, 枠番: 1, 馬名: カレンブーケドール, 払い戻し: 280円(5人気)
  • ワイド : 馬番: 2, 枠番: 2, 馬名: ワグネリアン と 馬番: 1, 枠番: 1, 馬名: カレンブーケドール と 馬番: 1, 枠番: 1, 馬名: カレンブーケドール

2019/11/24 ジャパンC ~機械学習(重回帰分析)による競馬のタイム予測~

2019年11月25日

有馬記念(2019/12/22)

  • 当選なし

2019/12/22 有馬記念 ~機械学習(重回帰分析)による競馬のタイム予測~

2019年12月22日

3. 単勝のみで計算すると合計収支がプラスになりました!

全てのレース結果を集計すると、だいたい半分くらいのレースで何かしら当選していることがわかります。

わかりやすく単勝の結果で見てみると、当選が3回ありました。

9戦3勝なので勝利は約30%です。

なかなか悪くないですよね。

そしてここから得られるリターンは大阪杯の2,220円、スプリンターズSの290円、天皇賞(秋)の160円で合計2,670円でした。

仮に予測が算出できた全9レースに100円ずつ単勝をかけていたら合計で900円になります。

900円に対して2,670円のリターンなのでおよそ3倍です。

悪くないんじゃないでしょうか。

大阪杯の単勝が圧倒的なリターンをもたらしてくれています。

もともと人気の低かった馬だったのでリターンも大きくなりました。

レースをみながら大興奮したのを思い出します!

 

また、単勝以外で検証すると少々めんどくさくなります。

複勝やワイドは組み合わせがいくつかあるので、全ての組み合わせを購入していたら収支はもちろんマイナスになります。

4. 今後の課題や感想→予測をするとレースが段違いに楽しくなる

さて、2019年のデータ分析のお遊び企画としてノリで始めたこちらの機械学習(重回帰分析)を利用した競馬予測ですが、結果としてはトータル収支がプラスになる結果となりました。

機械学習についても僕自身で独学しまして、「身につけた知識を何かしらの形でアウトプットしたい」との思いがきっかけで始まりました。

スクレイピングによるデータの収集から、データ整理、モデル構築から予測まで全て一貫することで実践的な知識を身につけることができたと実感しています。

やはり、習っただけと、実際に習った知識を活かして何かしらのアウトプットを出したとでは理解の深さが全然違います。

実際にやってみないとわからない苦労もたくさんあるわけです。

ぶっちゃけ、データさえ揃っていれば予測モデルを作るのはそこまで難しくありません。

問題はデータをどうやって集めて使える状態に綺麗にするかです。

ここが一番苦労します。

こうした経験もゼロからやってみることで初めてわかることなので大きな経験となりました。

 

ただし、今回の予測モデルに利用した重回帰分析は、過去データをもとに予測するというものになるので、過去データが十分にない新馬などに対しては予測をかけることができませんでした。

これを改善するには別のモデルを構築する必要があります。

インプットデータを変えたり、回帰分析ではなくてディープラーニングを用いたりと、さらなる検討が必要になります。

この辺りの知識は僕自身もまだまだ不十分なので継続的に学習していけたらと思います。

 

また、今回の競馬予測のプログラムが全てPythonで書きました。

PythonはAIやデータ分析に強いプログラミング言語で、世界中で人気を集めています。

【いますぐ始められます】データ分析をするならPythonが最適です。【学習方法もご紹介します!】

2019年11月10日

コードがシンプルでとても学びやすいのでとてもオススメです。

僕自身もUdemyというオンライン動画学習サイトを利用して独学でPythonを学びました。

プログラミングの独学にUdemyをおすすめする理由!【僕はUdemyでPythonを独学しました!】

2020年4月22日

 

さらに本サイトでは、Pythonを用いたデータ分析として、競馬予測の他にも歌詞分析や賃貸情報の分析など様々なことに挑戦しています。

【Pythonで不動産データ分析!】SUUMOをスクレイピングして情報収集!理想の賃貸物件を探してみた!

2020年3月29日

2020年12月31で活動休止を発表した「嵐」の歌詞を可視化してみた!

2019年3月24日

話題の勤労統計調査を元のデータと再集計データで比較してみました!

2019年3月14日

今後もこのサイトを通じて様々なことをご紹介していけるように、勉強を継続していこうと思います。

まとめ

いかがでしたでしょうか。

ここでは、2019年に行った競馬予測の結果をまとめて、年間の収支を算出してみました。

結果としては、予測が算出できた全てのレースで単勝を購入していた場合には、収支はトータルでプラスになりました。

しかもリターンは約3倍という好成績を達成することができました。

 

予測に用いた機械学習(重回帰分析)を独学で勉強し、予測に必要なデータの取集からデータの整理、モデル構築、予測までを一貫して行うことで、教科書で習うだけではわからない苦労などを身を以て体験することができました。

やはり何か新しいことを学んだ際には何かしらの形でアウトプットをすると理解もより深まると思います。

とりあえず、この競馬予測については2019年で終了しましたが、今後も何か面白い企画ができないか探し続けていこうと思います!

【迷っている方へ!】プログラミングに興味を持ったらとりあえずやってみよう!

【迷っている方へ!】プログラミングに興味を持ったらとりあえずやってみよう!

2020年7月21日

【人気上昇中】今人気のプログラミング言語「Python」は何ができるのか?できることまとめます【転職でも有利です】

2020年6月14日

プログラミング学習は独学とプログラミングスクールどちらにすべきか?【結論、全部試すべし!】

2020年6月12日

プログラミングの独学にUdemyをおすすめする理由!【僕はUdemyでPythonを独学しました!】

2020年4月22日

【挫折しないために!】プログラミングを学習するためには目的意識が重要!途中で挫折する人の特徴とは?

2020年2月24日

おすすめプログラミング学習方法

TECH::CAMP

いつでも講師に質問できるチャットシステムが最強です!

TECH::CAMPで無料体験講座を受けてみる

CodeCamp

講師とのマンツーマンレッスンで挫折しない!

CodeCampで無料体験講座を受けてみる

Udemy

圧倒的な安さ(セール時)で上質な動画学習素材が手に入る!僕はこれ使いました。

Udemyで講座を探す