天気が悪いとレースは荒れやすくなるのか【2017~2021年の中央競馬データで検証】
天気が悪いとレースは荒れやすくなるのか
本記事では、この疑問についてデータに基づいて検証していきます。
管理人の考えでは、天気は馬場へ影響を与えるのでレース結果にもそれなりの影響を与えるのではないかと推測しています。
天気が悪くなると馬場が悪くなり、最終的にレースが荒れやすくなるのではないかと疑っています。
この仮説が正しいのかどうか、データを使って調べていきます。
データの準備
まずはデータの準備です。
今回は、2017~2021年の中央競馬のデータを使って検証していきます。
該当レースは17,273個です。
ここからさらに距離で絞ります。
最もレース数の多かった距離の上位5つ(多い順に1,800、1,200、1,400、1,600、 2,000)で絞りました。
該当レースは13,361レースです。
単勝オッズで比較する
レースが荒れた荒れないについては、単勝オッズで判断していきます。
単勝オッズの高い馬が勝利すれば、番狂わせが起きた、つまりレースが荒れたと捉えることができます。
データ全体を確認する
まずは全体をみていきます。
1着になった馬の単勝オッズを集計した結果、データ数としては全部で13,383個ありました。
レース数より多いのは、同着で1着になっているレースが存在するためです。
平均オッズは約10.17で、中央値は4.8でした。
第一四分位は2.8、第三四分位は9.6と、だいたい全体の75%はオッズ10倍未満に収まっていることがわかります。
ちなみに標準偏差は19.10、最小値は1.1、最大値は450.1です。
外れ値を除外する
データのばらつきが大きいので、外れ値の除外を行います。
外れ値はデータの集計に悪影響を及ぼすため、あらかじめ排除しておく必要があります。
オッズのヒストグラムで表すと、概ね対数正規分布であることが確認です。
*こちらのグラフは横軸が対数になっています。
これを利用して、オッズの対数を計算し、その平均値(μ)と標準偏差(σ)から外れ値を除外するための閾値を算出します。
閾値は μ±2σ とし、これを計算すると、オッズの有効範囲は0.85〜37.56となり、この範囲に収まらないデータは外れ値として除外します。
外れ値を除外した結果、有効データ数は12,807個となりました。
元データは13,383個だったので、576個のデータが外れ値として除外されたことになります。
この結果、平均オッズは7.11、中央値は4.6、標準偏差は6.76と、かなりばらつきが小さくなりました。
最小値は1.1、最大値は37.5、第一四分位は2.80、第三四分位は8.50です。
これで準備完了です。
結果を確認する
それでは結果の確認に進みます。
全体では大きさ差は見られない
まずは全体のデータをみてみます。
天気 | 平均 | 中央値 | 標準偏差 | データ数 |
---|---|---|---|---|
晴 | 7.08 | 4.50 | 6.78 | 7787 |
曇 | 7.15 | 4.60 | 6.84 | 3773 |
小雨 | 7.37 | 4.90 | 7.00 | 455 |
雨 | 6.93 | 4.80 | 6.03 | 771 |
小雪 | 8.62 | 5.45 | 8.77 | 16 |
雪 | 5.26 | 5.00 | 2.77 | 5 |
小雪や雪はデータ数が少ないのであまり参考になりません。
全体の傾向を見ると、平均値と中央値どちらも天気による大きな差は見られないことがわかります。
「芝」と「ダート」で分類しても大きな差はない
次に少し細かく、芝とダートで分けてみていきます。
芝とダートだと、天気による影響は見られるのでしょうか。
オッズの平均値で見てみます。
コースタイプ | 晴 | 曇 | 小雨 | 雨 |
---|---|---|---|---|
ダート | 7.00 | 7.33 | 7.57 | 6.94 |
芝 | 7.16 | 7.01 | 7.21 | 6.91 |
こちらについても、大きな差は見られないことがわかります。
距離別で見ると短距離で少し差が出た
最後に距離別で見てみます。
こちらもオッズの平均値で見てみます。
距離 | 晴 | 曇 | 小雨 | 雨 |
---|---|---|---|---|
1200m | 7.68 | 7.61 | 7.86 | 6.74 |
1400m | 7.41 | 7.65 | 7.26 | 6.47 |
1600m | 7.04 | 6.46 | 6.32 | 7.34 |
1800m | 6.58 | 6.85 | 7.37 | 7.17 |
2000m | 6.75 | 7.05 | 7.41 | 6.76 |
結果を見ると、1200mと1400mの短距離では雨になるとオッズが少し低いことがわかります。
短距離で雨になるとレースが荒れにくい、つまり予想通りの展開になることが多いのでしょうか。
ただし、1800mになると雨の方がオッズが高い傾向となり、2000mになると大差ありません。
また、晴の結果に注目してみると、距離が長くなるにつれてオッズが低くなっていることがわかります。
番狂わせが起こりやすいのは短距離であることが見てとれます。
グラフで示すと、晴の場合のみ距離とオッズに関係が明確に出ています。
短距離だと雨の場合にオッズが下がっていることがよくわかります。
まとめ
ここでは天気が悪いとレースは荒れやすくなるのかについて、データを使って検証してみました。
全体で見ると大差ない結果となりました。
芝とダートで見ても大差ありません。
距離別にみると、短距離では少し差があるように見えました。
また、晴の場合は、距離が長くなるにつれて平均オッズが減少していくことが確認できました。
荒れやすい傾向にあるのは、晴れた日の短距離で、雨になると条件が悪くなり番狂わせが起きにくくなるのかと推測できます。
こういった結果を予想に組み込めば、精度が幾分か向上するのではないでしょうか。