続・統計学で犠牲フライを分析 vol.1
前回犠牲フライを統計学で分析したところ、「定位置の横から後ろ(横から前)に移動して捕球した時、3塁走者は生還できる(できない)」と分かりました。
その際、「3塁走者の走力」や「捕球者の肩力」を全く考慮していませんでした。そこで、今回は「3塁走者の走力」や「捕球者の肩力」を考えることで、3塁走者の生還・非生還を明確な確率として算出していこうと思います。
3塁走者の走力
セイバーメトリクスにある、走者の走力を評価する指標を3つ紹介します。1つ目は「平均的な走者と比較して盗塁を除く走塁で、何得点分チームに貢献したか、あるいは損失を与えたか」を推定するUBR、2つ目は「平均的な走者と比較して盗塁することで、何得点分チームに貢献したか、あるいは損失を与えたか」を推定するwBS、3つ目は「UBR + wBS」で推定されるBsRとなっています。今回は、盗塁を含む走力全てを表現できるBsR(リーグ別で算出)を解析に用いました。
見慣れないセイバーメトリクス指標なので、少しイメージが湧きづらいかもしれません。そこで、2014年のBsRのベスト5とワースト5をリーグごとに出してみました。
捕球者の肩力
補殺数のみを肩力として扱っても良いのですが、「強肩なので進塁しなかった」という強肩による抑止力の部分が扱われていませんでした。そこで今回はセイバーメトリクス指標のAR(アームレイティング)を解析に用いました。ARというのは「平均的な選手と比べて肩力でどれだけ失点(進塁)を防いだか」を推定する指標です。
こちらも見慣れないセイバーメトリクス指標なので、少しイメージを持ってもらうために、2014年のARの値が最も良かった選手と悪かった選手をポジションとリーグごとに出してみました。なお、複数ポジション守った選手はポジションごとにAR値を算出しています。
生還率を算出
前回算出した、定位置からの「移動距離」と「移動角度」、そして今回考えた「BsR(3塁走者の走力)」と「AR(捕球者の肩力)」の4つの変数を用いて、生還率(「3塁走者が生還できる確率」あるいは「3塁走者が本塁アウトや3塁ストップにならなかった確率」)を統計的に算出していきました。
手法はロジスティック回帰分析を使いました。数学的な説明は省きますが、ロジスティック回帰分析は「成功・失敗」、「好き・嫌い」、「発病する・しない」などの結果が2択のものに対して、ある値の時にどれだけの確率で起こりうるかを推定する手法です。マーケティングや医療など幅広い分野で使われています。2013年のデータに対してロジスティック回帰分析を用いて3塁走者の生還・非生還を4つのパラメータで確率として算出しました。
※捕球位置の左右の影響があまりなかったので、移動角度のプラス角度とマイナス角度に差はないとして全てプラス角度として扱いました。(例えば、「-120°」→「120°」)
求めた式の精度を見るために2014年のデータに対して、3塁走者の生還率を予測しました。生還率が0.5以上のものは生還、0.5未満のものは非生還として単純に扱い、実際の結果と照らし合わせてみました。
正解率は (127+361)/560≒0.87 と約9割の精度で3塁走者が生還あるいは非生還かを予測可能だと判明しました。
次回(近日公開予定)は「3塁走者 阿部選手」「ライト 平田選手」での生還率など具体的な部分を見ていきましょう!