馬場が悪いとレースは荒れやすくなるのか【2021年の中央競馬データで検証】
馬場が悪いとレースは荒れやすくなるのか
本記事では、この疑問をデータに基づいて検証していきます。
競馬コースの状態のことを馬場といい、芝なら芝の状態、ダートなら砂の状態を指します。
重要になるのが水分含有率で、4段階に分けて表されます。
水分含有量の低い順、つまり馬場が良い状態順に、「良」「稍重」「重」「不良」となります。
馬場が悪くなる番狂わせ、つまりレースが荒れるのではないか?というのが仮説です。
これが本当かどうかをデータを使って調べてみます。
データの準備
まずはデータの準備です。
今回は、2021年の中央競馬のデータを使って検証していきます。
該当レースは3,456個です。
ここからさらに距離で絞ります。
最もレース数の多かった距離の上位5つ(多い順に1,800、1,200、1,400、1,600、 2,000)で絞りました。
該当レースは2,666レースです。
単勝オッズで比較する
レースが荒れた荒れないについては、単勝オッズで判断していきます。
単勝オッズの高い馬が勝利すれば、番狂わせが起きた、つまりレースが荒れたと捉えることができます。
データ全体を確認する
まずは全体をみていきます。
1着になった馬の単勝オッズを集計した結果、データ数としては全部で2,673個ありました。
レース数より多いのは、同着で1着になっているレースが存在するためです。
平均オッズは約9.85で、中央値は4.7でした。
第一四分位は2.8、第三四分位は9.3と、だいたい全体の75%はオッズ10倍未満に収まっていることがわかります。
ちなみに標準偏差は17.95、最小値は1.1、最大値は299.5です。
外れ値を除外する
オッズデータを見ると、極端に高い値が散見されます。
こういったデータがあると結果に悪影響を及ぼすため、比較前に外れ値の除外を行います。
オッズのヒストグラムで表すと、概ね対数正規分布であることが確認できます。
*こちらのグラフは横軸が対数になっています。
これを利用して、オッズの対数を計算し、その平均値(μ)と標準偏差(σ)から外れ値を除外するための閾値を算出します。
閾値は μ±2σ とし、これを計算すると、オッズの有効範囲は0.86〜36.03となり、この範囲に収まらないデータは外れ値として除外します。
外れ値を除外した結果、有効データ数は2,551個となりました。
元データは2,673個だったので、122個のデータが外れ値として除外されたことになります。
この結果、平均オッズは6.84、中央値は4.5、標準偏差は6.43と、かなりばらつきが小さくなりました。
最小値は1.1、最大値は35.9、第一四分位は2.75、第三四分位は8.3です。
これで準備完了です。
結果を確認する
それでは結果の確認に進みます。
全体では僅かな差
まずは全体のデータをみてみます。
馬場 | 平均オッズ | 中央値 | 標準偏差 | データ数 |
---|---|---|---|---|
良 | 6.85 | 4.40 | 6.46 | 1783 |
稍重 |
6.76 | 4.55 | 6.27 | 420 |
重 | 7.06 | 4.70 | 6.26 | 213 |
不良 | 7.12 | 4.60 | 6.75 | 135 |
全体で比較すると、大きな差は見られないことがわかります。
大きな差はありませんが、馬場が悪くなるにつれて平均オッズは僅かに上昇しているように見えます。
「芝」と「ダート」で分類すると差があった
次に少し細かく、芝とダートで分けてみていきます。
基本的には芝の方が荒れやすい傾向にありますが、馬場別にみるとどうでしょうか。
コースタイプ | 馬場 | 平均オッズ | 中央値 | 標準偏差 | データ数 |
---|---|---|---|---|---|
芝 | 良 | 6.92 | 4.40 | 6.71 | 1040 |
芝 | 稍重 | 6.97 | 4.70 | 6.41 | 182 |
芝 | 重 | 7.61 | 5.80 | 5.87 | 71 |
芝 | 不良 | 7.58 | 6.35 | 6.15 | 26 |
ダ | 良 | 6.75 | 4.40 | 6.11 | 743 |
ダ | 稍重 |
6.59 | 4.45 | 6.17 | 238 |
ダ | 重 | 6.78 | 4.45 | 6.45 | 142 |
ダ | 不良 | 7.01 | 4.30 | 6.91 | 109 |
これはなかなか面白い結果です。
芝は、僅かではありますが、馬場が悪くなるにつれて平均オッズ、中央値ともに上昇していることがわかります。
ダートは中央値にこそ差はないものの、平均オッズは馬場が悪くなるにつれて僅かに上昇しています。
また、芝とダートで比べると、いずれの馬場においても「芝」の方が平均オッズは高い傾向にあります。
中央値で見ても「良」以外は芝の方が高いです。
元々荒れやすい「芝」は、馬場が悪くなるとさらに荒れやすくなると言えるのではないでしょうか。
まとめ
ここでは馬場とレースの荒れやすさの関係について、データを使って検証してみました。
全体で見ると、大きな差こそないものの、馬場が悪くなるにつれて僅かに平均オッズが上昇していることが確認できました。
また、「芝」と「ダート」で比較すると、「芝」の方がレースは荒れやすく、馬場が悪くなるとさらに荒れやすくなる傾向になることも確認できました。
特に「芝」レースを予想する際にはこういった波乱要素も考慮して予想を行うと良いのではないでしょうか。