「AI 競馬予想って結局何を見てるの?」
「AI 競馬予想ってブラックボックスでよく分からない」「結局は人気馬を選んでるだけ?」
シリーズ完結編として、Stride AI が実際にどんなシグナルを見ているかを開示します。結論: 1 頭の馬について約 100 のシグナル を計算し、LightGBM で統合して真の勝率を推定しています。12 頭立てなら 1 レースで 1,200 個のシグナル を数百ミリ秒で並列処理。
「100」という数字の意味
人間の脳は同時に 7±2 個の情報しか保持できない (マジカルナンバー 7)。100 vs 7、情報量の差そのものが AI のエッジです。
シグナル分類 (7 カテゴリ約 100 個)
A: 馬の能力指標 (20) / B: コース・距離適性 (15) / C: 騎手・厩舎・血統 (20) / D: 展開・ペース予測 (10) / E: 当日要素 (15) / F: 市場シグナル (10) / G: 環境要素 (10)
A. 馬の能力指標 (約 20 個)
- 過去 5 走の 着順・着差・タイム
- 過去 5 走の 上がり 3F・通過順位
- 連対率・複勝率 (直近 10 走)
- 同距離・同コースでの通算成績
- 重賞での着順履歴・キャリア戦数・馬体重推移
B. コース・距離・馬場適性 (約 15 個)
「馬は得意な条件で本来の実力を出す」を定量化:
- 距離別・コース別・馬場別の連対率
- 内枠・外枠別成績
- 道悪適性指数 (馬場状態別の着差変化)
市場は「馬の条件適性」を細かく評価できていないので、ここに歪みが残ります。
C. 騎手・厩舎・血統 (約 20 個)
騎手は 騎手プレミアム 記事の通り、名前ではなく過去成績統計を採用:
- 騎手のコース別・距離別・馬場別連対率
- 騎手 × 馬の過去の相性
- 厩舎成績全般・調教師の傾向
- 父系・母系・母父の距離適性
D. 展開・ペース予測 (約 10 個)
- 各馬の脚質 (逃げ・先行・差し・追込)
- 競合する逃げ・先行馬の頭数
- 想定ペース (ハイ・ミドル・スロー)
- テン 3F・上がり 3F 予測タイム
「逃げ馬が複数いる」レースでは共倒れ確率が上昇し、差し馬の期待値が上がります。人間が直感的に評価しづらいシグナルで、AI のエッジが出やすい場面です。
E. 当日要素 (約 15 個)
Stride AI は 発走 4 分前 に最終推奨を出すので、当日要素も反映:
- 当日朝の馬体重・前走比増減
- 調教タイム (一週前・最終追い切り)
- 出走間隔・連闘・前走の輸送ダメージ
F. 市場シグナル (約 10 個)
オッズの動き自体もシグナル:
- オッズの初期値と最終値の差
- 急変動の方向 (人気上昇 or 下降)
- 単勝オッズと複勝オッズの比
- 馬連オッズの不整合度
G. 環境要素 (約 10 個)
- 馬場状態・クッション値・天候・気温
- 開催日の何日目か (馬場の傷み度合い)
- 同日の他レース結果からの推定馬場傾向
「単独」ではなく「相互作用」
例: 「上がり 3F = 35.0 秒」は速いか遅いか?
- 高速馬場の良走路なら 普通
- 重馬場の中山なら 超優秀
- スローペースの直線競馬なら 平凡
「条件 × 数値」の組み合わせで初めて意味が出る。LightGBM はこの相互作用を 自動学習。数千の条件付きルールをツリー構造で持ちます。
100 のシグナルを「1 つの期待値」に
- Step 1馬の特徴量を全 100 個計算
- Step 2LightGBM に入力 → 予測勝率 (0〜1)
- Step 3単勝オッズと比較 → EV 計算
- Step 4EV > 0.10 の馬を期待値プラスとして抽出
- Step 5ケリー基準で資金管理付き推奨
まとめ
- Stride AI は 1 頭あたり 約 100 のシグナル を計算
- カテゴリは 7 つ (能力・適性・人的要素・展開・当日・市場・環境)
- 単独ではなく 相互作用 で初めて意味が出る
- 人間 7 個 vs AI 100 個 = 情報量で 14 倍の差
- 「AI はブラックボックス」ではなく「人間が処理できない情報量を統計的に扱う」だけ
