コラム

コース距離別にベストな馬体重は存在するのか【2021年の中央競馬データで検証】

2022年01月31日 18:00:00

コース距離別にベストな馬体重は存在するのか。

本記事ではこの疑問を解消すべく、データで検証していきます。


管理人のイメージでは、短距離ではスピード重視で体重が軽い方が強く、距離が長くなると体力が必要になることから少し脂肪があった方がいいのではないか、というイメージを勝手に持っていたりします。

本当のところはどうなのかというのをデータをみて検証していきます。


データは2021年の中央競馬のデータを使う


まずはデータの準備です。

今回は2021年の中央競馬のデータを使って検証していきます。

該当するレースは3,456レースです。


ここからさらに最もレース数の多かった距離の上位5つ(多い順に1,800、1,200、1,400、1,600、 2,000)で絞ります。

これで分析対象となるレースは2,666レースです。


馬体重を集計する


データの準備が整ったので、結果を見ていきます。


全体のデータをヒストグラムで可視化する


まずは全体をみていきます。

ヒストグラムで可視化してみましょう。

用意したデータのうち、3着以内に入った馬に絞って表示しています。


きれいな正規分布です。

データ数は8,006個、平均値は474.1、中央値は474です。

標準偏差は28.2、最小値は380、最大値は584です。


470kgあたりがベスト体重といえるのでしょうか。


距離別で比較すると差は出るか


次に本記事の本題である、コース距離別の馬体重をみていきます。

ヒストグラムで表示すると比較が難しいので、ここではカーネル密度関数で表記します。



みた感じ、そこまで差は見られないように思います。

1200と1400が若干左に寄ってるようにも見えます。


数値でみてみます。


コース距離 平均馬体重 中央値 標準偏差 データ数
1200 469.33 470.0 27.86 2040
1400 475.97 474.0 27.38 1275
1600 473.19 472.0 28.30 1175
1800 477.89 478.0 28.35 2408
2000 473.50 472.0 27.95 1108


中央値で見ても、平均値で見ても、距離との関係はなさそうですね。

相関係数を計算しても、距離と平均馬体重の相関係数は0.50、距離と中央値の相関係数は0.42でした。


ちなみに、馬体重の平均値(μ)と標準偏差(σ)を計算し、μ±2σの範囲内に収まらないデータを外れ値として除外したうえであらためて計算しても、距離と平均値および中央値の相関係数はそれぞれ0.50と0.42でほぼ変わりませんでした。


まとめ


ここではコース距離別にベストな馬体重は存在するのか。という疑問を解決するための検証を行いました。


全体的なデータとして、ベスト体重は470kgあたりという結果はでましたが、距離ごとの変化は見られませんでした。

競馬予想を行う際には、距離に関わらず馬体重470kg付近を目安にしてみるといいかもしれません。



ブログランキング参加中!

どれか1つでもクリックいただけると励みになります。よろしくお願いいたします。

にほんブログ村 競馬ブログへ 競馬ブログ・ランキング

ブログランキング参加中!

どれか1つでもクリックいただけると励みになります。よろしくお願いいたします。

にほんブログ村 競馬ブログへ 競馬ブログ・ランキング