統計学で犠牲フライを分析
最近、セイバーメトリクスという言葉を耳にする機会が増えたと思います。スポーツ番組や雑誌等で見かけることも増えました。その流れはプロ野球界にも来ており、データ分析専門のスタッフがいるチームもあります。そこで今回は野球データを統計学的に分析してみたいと思います。犠牲フライ時の3塁走者の生還・非生還に着目して、犠牲フライを統計学的に分析していきます。
犠牲フライ可能場面
2012,13年セ・パ両リーグ全試合のデータを使って分析していきます。
ここで、「0,1アウトで3塁走者がいる場面で外野フライが飛んだ場面」を「犠牲フライ可能場面」と定義します。
犠牲フライ可能場面をまとめると表1のようになります。なお、非生還時は「3塁ストップ」と「本塁アウトの場面」を合計した場面数となっています。
図1,2を見ると、単純に外野フライの飛距離が長いと生還、短いと非生還であると読み取れます。つまり犠牲フライは本塁からの距離に大きく影響を受けていると考えられます。
次に、定位置からどこに移動して捕球しているのかを調べていきます。その際、定位置の推定も行っていきたいと思います。
外野手の定位置推定
野手の定位置というのは正確にここであるという決まりはありません。チームごとに多少なりとも違いが有るはずです。そこで今回は定位置を次のように考えて、統計的に推定していきました。
「ヒット・アウト」、「ゴロ・フライ・ライナー」、「右打者・左打者」という区別をせず、より多くボールを捕球できる位置を定位置とする(全ての打球に対応できる位置が定位置)
このように定位置を考え、2012,13年にレフト、センター、ライトがそれぞれ捕球した全ての打球を使って、統計的に定位置を推定していくこととしました。その際、カーネル密度推定法という統計的手法を用いました。数学的な説明は省きますが、簡単に言うとカーネル密度推定法を使うことにより、多く打球を捕球した位置がヒートマップのように赤く色づいていき定位置の推定ができるというものです。
「移動距離」と「移動角度」
定位置からどこに移動して捕球しているのかを調べるために、定位置から捕球位置までの「移動距離」を考えます。その際、10m前進して捕球する場合と10m後退して捕球する場合は異なります。そこで、「移動距離」に加えて「移動角度」も考えていくこととします。
まず、本塁と定位置を結ぶ直線Lを考えます。その直線Lと捕球位置が成す角度をθと置き、−180°≦θ≦180°で定義します。つまり自らが定位置にいて本塁を向いているとすると、θ= 0°が正面、θ= −90°が左、θ= 90°が右、θ= −180°, 180°が後ろを指しています。
「移動距離」と「移動角度」をもとに、犠牲フライ可能場面を外野手の定位置から見ていきます。カーネル密度推定法も使い、どこで最も多く捕球しているかも明らかにしていきます。
図5の生還時を見ると、後ろから左右(「−180°~−90°」と「90°~180°」)でよく赤く色づいており、後ろから左右の捕球が多いと分かります。非生還時を見ると左右から正面(「−90°~90°」)でよく赤く色づいており、左右から正面での捕球が多いと分かります。
これらのことより統計的に分かったことは
・定位置より横から後ろに後退して捕球した時、3塁走者は生還できる
・定位置より横から正面に前進して捕球した時、3塁走者は生還できない
という2つの点です。
今後、3塁走者の走力や捕球者の肩力を考慮して分析していくことで、犠牲フライでの3塁走者の生還・非生還がより明瞭に統計的に表現できるはずです。
※本研究は第4回スポーツデータ解析コンペティションにてデータスタジアム特別賞を受賞しました。コンペティションのレポートはこちら
※スポーツデータ解析コンペティションの詳細はこちら