コース距離別にベストな馬体重は存在するのか【2021年の中央競馬データで検証】
コース距離別にベストな馬体重は存在するのか。
本記事ではこの疑問を解消すべく、データで検証していきます。
管理人のイメージでは、短距離ではスピード重視で体重が軽い方が強く、距離が長くなると体力が必要になることから少し脂肪があった方がいいのではないか、というイメージを勝手に持っていたりします。
本当のところはどうなのかというのをデータをみて検証していきます。
データは2021年の中央競馬のデータを使う
まずはデータの準備です。
今回は2021年の中央競馬のデータを使って検証していきます。
該当するレースは3,456レースです。
ここからさらに最もレース数の多かった距離の上位5つ(多い順に1,800、1,200、1,400、1,600、 2,000)で絞ります。
これで分析対象となるレースは2,666レースです。
馬体重を集計する
データの準備が整ったので、結果を見ていきます。
全体のデータをヒストグラムで可視化する
まずは全体をみていきます。
ヒストグラムで可視化してみましょう。
用意したデータのうち、3着以内に入った馬に絞って表示しています。
きれいな正規分布です。
データ数は8,006個、平均値は474.1、中央値は474です。
標準偏差は28.2、最小値は380、最大値は584です。
470kgあたりがベスト体重といえるのでしょうか。
距離別で比較すると差は出るか
次に本記事の本題である、コース距離別の馬体重をみていきます。
ヒストグラムで表示すると比較が難しいので、ここではカーネル密度関数で表記します。
みた感じ、そこまで差は見られないように思います。
1200と1400が若干左に寄ってるようにも見えます。
数値でみてみます。
コース距離 | 平均馬体重 | 中央値 | 標準偏差 | データ数 |
---|---|---|---|---|
1200 | 469.33 | 470.0 | 27.86 | 2040 |
1400 | 475.97 | 474.0 | 27.38 | 1275 |
1600 | 473.19 | 472.0 | 28.30 | 1175 |
1800 | 477.89 | 478.0 | 28.35 | 2408 |
2000 | 473.50 | 472.0 | 27.95 | 1108 |
中央値で見ても、平均値で見ても、距離との関係はなさそうですね。
相関係数を計算しても、距離と平均馬体重の相関係数は0.50、距離と中央値の相関係数は0.42でした。
ちなみに、馬体重の平均値(μ)と標準偏差(σ)を計算し、μ±2σの範囲内に収まらないデータを外れ値として除外したうえであらためて計算しても、距離と平均値および中央値の相関係数はそれぞれ0.50と0.42でほぼ変わりませんでした。
まとめ
ここではコース距離別にベストな馬体重は存在するのか。という疑問を解決するための検証を行いました。
全体的なデータとして、ベスト体重は470kgあたりという結果はでましたが、距離ごとの変化は見られませんでした。
競馬予想を行う際には、距離に関わらず馬体重470kg付近を目安にしてみるといいかもしれません。