「AI 競馬予想って結局何を見てるの?」

AI 競馬予想ってブラックボックスでよく分からない」「結局は人気馬を選んでるだけ?

シリーズ完結編として、Stride AI が実際にどんなシグナルを見ているかを開示します。結論: 1 頭の馬について約 100 のシグナル を計算し、LightGBM で統合して真の勝率を推定しています。12 頭立てなら 1 レースで 1,200 個のシグナル を数百ミリ秒で並列処理。

「100」という数字の意味

人間の脳は同時に 7±2 個の情報しか保持できない (マジカルナンバー 7)。100 vs 7、情報量の差そのものが AI のエッジです。

シグナル分類 (7 カテゴリ約 100 個)
A: 馬の能力指標 (20) / B: コース・距離適性 (15) / C: 騎手・厩舎・血統 (20) / D: 展開・ペース予測 (10) / E: 当日要素 (15) / F: 市場シグナル (10) / G: 環境要素 (10)

A. 馬の能力指標 (約 20 個)

  • 過去 5 走の 着順・着差・タイム
  • 過去 5 走の 上がり 3F・通過順位
  • 連対率・複勝率 (直近 10 走)
  • 同距離・同コースでの通算成績
  • 重賞での着順履歴・キャリア戦数・馬体重推移

B. コース・距離・馬場適性 (約 15 個)

「馬は得意な条件で本来の実力を出す」を定量化:

  • 距離別・コース別・馬場別の連対率
  • 内枠・外枠別成績
  • 道悪適性指数 (馬場状態別の着差変化)

市場は「馬の条件適性」を細かく評価できていないので、ここに歪みが残ります。

C. 騎手・厩舎・血統 (約 20 個)

騎手は 騎手プレミアム 記事の通り、名前ではなく過去成績統計を採用:

  • 騎手のコース別・距離別・馬場別連対率
  • 騎手 × 馬の過去の相性
  • 厩舎成績全般・調教師の傾向
  • 父系・母系・母父の距離適性

D. 展開・ペース予測 (約 10 個)

  • 各馬の脚質 (逃げ・先行・差し・追込)
  • 競合する逃げ・先行馬の頭数
  • 想定ペース (ハイ・ミドル・スロー)
  • テン 3F・上がり 3F 予測タイム

「逃げ馬が複数いる」レースでは共倒れ確率が上昇し、差し馬の期待値が上がります。人間が直感的に評価しづらいシグナルで、AI のエッジが出やすい場面です。

E. 当日要素 (約 15 個)

Stride AI は 発走 4 分前 に最終推奨を出すので、当日要素も反映:

  • 当日朝の馬体重・前走比増減
  • 調教タイム (一週前・最終追い切り)
  • 出走間隔・連闘・前走の輸送ダメージ

F. 市場シグナル (約 10 個)

オッズの動き自体もシグナル:

  • オッズの初期値と最終値の差
  • 急変動の方向 (人気上昇 or 下降)
  • 単勝オッズと複勝オッズの比
  • 馬連オッズの不整合度

G. 環境要素 (約 10 個)

  • 馬場状態・クッション値・天候・気温
  • 開催日の何日目か (馬場の傷み度合い)
  • 同日の他レース結果からの推定馬場傾向

「単独」ではなく「相互作用」

例: 「上がり 3F = 35.0 秒」は速いか遅いか?

  • 高速馬場の良走路なら 普通
  • 重馬場の中山なら 超優秀
  • スローペースの直線競馬なら 平凡

条件 × 数値」の組み合わせで初めて意味が出る。LightGBM はこの相互作用を 自動学習。数千の条件付きルールをツリー構造で持ちます。

100 のシグナルを「1 つの期待値」に

  1. Step 1馬の特徴量を全 100 個計算
  2. Step 2LightGBM に入力 → 予測勝率 (0〜1)
  3. Step 3単勝オッズと比較 → EV 計算
  4. Step 4EV > 0.10 の馬を期待値プラスとして抽出
  5. Step 5ケリー基準で資金管理付き推奨

まとめ

  • Stride AI は 1 頭あたり 約 100 のシグナル を計算
  • カテゴリは 7 つ (能力・適性・人的要素・展開・当日・市場・環境)
  • 単独ではなく 相互作用 で初めて意味が出る
  • 人間 7 個 vs AI 100 個 = 情報量で 14 倍の差
  • 「AI はブラックボックス」ではなく「人間が処理できない情報量を統計的に扱う」だけ