人工知能に選抜優勝校を予想させる
球春の訪れを告げる春の甲子園。今年の選抜高校野球大会(第88回選抜高校野球大会)は本日3月20日(日)に開幕します。毎年この時期がやってくると、出場校の秋季大会のデータや組み合わせ抽選の結果を見て、地元の学校がどこまで勝ち上がりそうか確認したり、大会冊子などを購入し優勝校を予想したりする方も多いのではないでしょうか。
今回のコラムでは過去3年分の選抜高校野球大会と秋季大会のデータを用いて機械学習をおこない、選抜高校野球大会の試合の勝敗を判別する判定器を作成し、今年の選抜高校野球大会の優勝校を予想します。
はじめに勝敗の予想をおこなう判定器について簡単に説明しておきましょう。判定器は試合をおこなう2校の秋季大会データと、先攻・後攻情報を入力すると、それぞれのチームに対して右表のような一塁側チームが先攻になった場合と、三塁側チームが先攻になった場合の、両校の評価値を算出します。判定器は算出された評価値を見て、評価値が大きいチームを「この試合で勝利する」と判定します。右表の場合、どちらのチームが先攻を取った場合でも福井工大福井の評価値が智弁学園の評価値を上回っているため、福井工大福井が2回戦に進出すると判定が出ています。
判定器に2015年の秋季大会のデータを入力し、得られたセンバツ初戦の予想を見てみましょう。
予想には、機械学習をおこない過去3年分の選抜高校野球大会の試合の勝敗を83%の確率で正しく判定できるようになった判定器を用いています。
「先攻」「後攻」どちらを取るかで勝敗予想が逆転する大会第2日第1試合
判定器は、どちらのチームが先攻(あるいは後攻)になるかも加味して評価値を算出します。大会第2日の第1試合、共に21世紀枠で出場の 釜石(岩手)-小豆島(香川) のカードは「後攻になったチームが勝利する」という予想が出ています(釜石が先攻となった場合は小豆島の評価値が釜石の評価値を37上回り、小豆島が先攻となった場合は釜石の評価値が小豆島の評価値を1上回る)。秋季大会では小豆島は犠打を、釜石は盗塁を用いて、少ないチャンスをものにしてきましたが、両校の戦いは甲子園でも同様にロースコアの試合展開になるでしょうか。過去3年の選抜大会を見てみると両チームの得点がどちらも3点以内の試合は後攻チームが25試合中15試合勝利しているため、近年の後攻優勢の傾向に沿った予想ともいえそうです。
1回戦では大会第5日の第1試合東海大甲府(山梨)-創志学園(岡山)の一戦も後攻チームが勝利すると予想が出ています。
判定器は必ずしも後攻が有利と判断するわけではなく、対戦する両校の特徴を考慮してそれぞれのチームが先攻後攻どちらを取った方が有利か(あるいはどちらを取っても変わらないか)を判断します。自チームの投手が走者を出しにくいタイプの投手でかつ長打力がある場合や、本塁打を記録した打者が多いなど高い攻撃力を誇るチーム同士の対戦の場合では先攻となった時の方が、評価値が高くなっているチームもあります。(今大会の1回戦では智弁学園、明徳義塾など)
優勝はどこなのか
選抜高校野球大会はトーナメント方式で大会がおこなわれるため、1つ前の試合の予想結果をもとに決勝までの試合を予想することができます。
実際に決勝戦までの予想をおこない優勝校がどこになるのか調べてみました。
1つ前の回戦でどちらのチームが勝ち上がるか決まらない場合、それぞれのチームが勝ち上がった場合の予想をおこなっています。
決勝戦までの予想をおこなったところ、勝ち残ったチームは関東一(東京)でした。2回戦以降は対戦校にある程度、対戦チームに評価値差をつけて勝ち上がってきましたが、1回戦の東邦(愛知)戦は評価値差3と僅差での勝ち上がりとなっています。今回、関東一は優勝候補にあがりましたが1回戦の突破が難所となりそうです。
他の予想に目を向けてみると1回戦で釜石(岩手)が後攻となった場合、21世紀枠で出場の釜石(岩手)と長田(兵庫)は共に準々決勝まで勝ち進んでいます。もし21世紀枠出場校が2校同時にベスト8進出となると選抜史上初の出来事となります。
予想が外れる時
現在勝敗の判定に用いているデータは、大きく分けると「①試合の先攻後攻」、対戦する両校の秋季大会の「②攻撃成績(出塁率、長打率、長打を打てる打者の人数、犠打、盗塁)」、「③投手成績(投球回、主戦投手の登板率、主戦投手の防御率、主戦投手のWHIP、主戦投手の投げ腕左右)」、「④神宮大会に出場しているか否」かの4つで、大会が開幕した後の情報(例えば初戦の結果・投打成績、次の試合までの間隔など)は考慮していません。そのためか、学習を終えた判定器で過去3年分の試合予想した所、評価値に大きく差があるにも関わらず予想が外れている試合が2回戦(2戦目)以降に多く見受けられました。また、1回戦であっても主戦投手が試合の序盤~中盤でマウンドを降りた試合でも同様の現象が起こっていました。
今回はある程度データを絞って機械学習をおこない判定器を作成しましたが、今後大会開幕後のデータなどを判定器に学習させることで予想精度を上げることも期待できそうです。
いかがだったでしょうか。今回は学習手法や過程は省略させていただきましたが、詳細が気になる方はこちら機械学習を用いてセンバツ出場校を予想するの記事も参考にして頂ければと思います。