TODAY'S HOT
  • 1998年5月29日 Happy Birthday!! 坂倉将吾(広島) 22歳
  • 2004年5月29日 野口茂樹(中日)が通算1000奪三振を達成。 (vs.阪神)
  • 1979年5月29日 落合博満(ロッテ)がプロ初出場を記録。(vs.南海)
  • 2000年5月29日 Happy Birthday!! 中神拓都(広島) 20歳
  • 1993年5月29日 郭泰源(西武)が全員安打を許しながら完封勝利を記録。 (vs.日本ハム)
  • 1996年5月29日 落合博満(巨人)が通算2000試合出場を達成。 (vs.ヤクルト)
  • 1991年5月29日 Happy Birthday!! 近藤大亮(オリックス) 29歳
コラム COLUMN

野球ビッグデータをより輝かせるために―結果の予測から新たな価値の創出を目指して―(後編)

株式会社スタージェン 菅谷 勇樹

2 アルトゥーベをどう抑えるか?―三振確率のモデル化から考察する―

 前編では、TextilePlotの表現からアルトゥーベをいかに抑えられるかが勝敗を分けるひとつの重要なポイントとなることがわかりました。そこで後編では、どのようにアルトゥーベを抑えればよいかを、奪三振確率を予測することで探ってみることにします。

 今回アルトゥーベ自身のデータは利用できませんでしたので、今シーズンNPBで打率3割を記録した、アルトゥーベと同じ右打者8名(バレンティンマートンルナ菊池涼介山田哲人内川聖一畠山和洋李大浩)のデータで代用して、打率のよい選手から三振を奪う方法を考えてみます。最終的にはロジスティックモデルという数学モデルを使って奪三振確率を予測し、有効な配球を探っていく予定ですが、まずはどのような要因が三振と関係しているのかを調べてみることにしましょう。

2.1 三振が奪える球種は?

図2:2ストライク後の球種と三振の関係を示すモザイクプロット

 2014年の全打席データから三振または2ストライクで終了した打席のデータを抽出して、投げた球種と三振との関係を「モザイクプロット」という図で確認してみます(図2)。
 長方形の面積の大きさはそれぞれの結果が生じた割合に対応していますので、例えば球種に着目すれば、ストレートで打席が終了した場面が一番多く、次にスライダー、フォークという順番になっていることがわかります。さらに打席結果についてみてみると、フォークは三振に対して有効ですが、カーブやチェンジアップは三振を奪う球としては不向きなようです。このように球種によって三振の奪いやすさが異なっていますので、球種は三振に影響を与える要因であると考えられそうです。

2.2 球種ごとに異なる座標の効果

 球種は三振に影響するひとつの要因であると考えられそうですが、もちろんストライクゾーンのどのコースにボールを投げるかということも影響を与えていると想像できます。
 そこで球種ごとに、座標の効果を''boxplot''という視覚表現を使って確認してみましょう。ここでは投手の側から見て左下に原点をとり、水平方向に x 軸、垂直方向に y 軸を取って球種ごとの効果をしらべてみます。投手の利き腕によってその結果が異なりますが、ここでは侍ジャパンに多く選出されている右投げ投手との対戦成績を対象とします。これ以降では右投手であることを仮定して話を進めますが、同様の解析は左投手であっても同じように行なうことができます。

図3:球種と投球された座標の関係を示すboxplot(左:x座標、右:y座標)

 それでは x 座標の効果を眺めてみましょう(図3左)。四角い箱の広がりはデータの半数がその範囲に収まっていることを表しており、箱の中にある太線でデータの中央値を示しています。例えばストレートのプロットに注目すれば、三振を奪ったときは外角、そうでない場合はほぼ真ん中にボールが投げられていることがわかります。特に三振とその他の場合で顕著な違いが見られる球種はカットボールで、ストライクゾーンを外れるようなコースに決まれば三振が奪いやすいことがわかります。
 y 座標の効果については、カーブ、カットボール、チェンジアップ、フォークではゾーンよりも低めに決まれば三振を取りやすそうですが、ストレートでは高さの違いがあまり見られないようすが見てとれます(図3右)。このように座標の効果も三振に影響を与えていますが、その効果の度合いは球種ごとに異なっているようですので、このことを反映したうえでモデルに導入した方がよさそうです。

2.3 得意コースの影響を考慮する

図4:打率3割以上の右打者8選手の安打コースを示すヒートマップ

 球種ごとに三振に有効なコースが異なることがわかりました。しかし、打者ごとに得意とするコースは異なりますので、すべての打者に共通してその投球が効果的であるかどうかはわかりません。
 実際8名の打者がヒットをよく打ったコースをヒートマップで表現すると図4のようになります。よくヒットを打っているコースを赤色で、あまり打っていないコースにいくにしたがって段階的に薄い色で表示しています。例えばバレンティンは真ん中高めと内角の中程度の高さの球を得意としていますが、内川や李大浩は中程度の高さの球を幅広くヒットにしていることがわかります。この図からもわかるように、三振確率をモデル化する際にはそれぞれの打者の得意コースも要因として取り入れる必要がありそうです。

2.4 アルトゥーベから三振を奪うには?

 これまでみてきたように、「球種」、「コース」、「打者の得意コース」は三振を奪う場合に考慮すべき要因といえそうです。そこでこれらの効果を取り入れたロジスティックモデルと呼ばれる数学モデルを構築し、三振確率を予測することでアルトゥーベに有効な配球を探ってみることにしましょう。今回肝心のアルトゥーベ自身の得意コースのデータはありませんので、外国人選手3名のデータで代用して、もしアルトゥーベが同じような得意コースを有していたらと仮定してどの配球が効果的かを考察してみることにします。以下では、それぞれのタイプの選手に対して、どのコースに、どの球種を球を投じれば、どれくらいの確率で三振が奪えるかを算出し、その上位5つの結果をまとめました。

バレンティンタイプには
バレンティンタイプは、「真ん中高めと、内角の中程度の高さコースを得意とする」タイプです。このタイプには、真ん中から外にかけてのフォークと、内角高めのシュートが効果的であるという結果になりました(表1)。

マートンタイプには
マートンタイプは、「中程度の高さの球を幅広く得意とする」タイプです。このタイプには、内角低めのカーブと、フォークが有効な決め球となりそうです(表2)。

ルナタイプには
ルナタイプは、「外角の中程度の高さ、真ん中、内角高めのコースを得意とする」タイプです。このタイプには、内角低めのカーブと、外角高めのストレートが有効なようです(表3)。


 解析結果から、3タイプの打者に共通してフォークが有効な決め球であることがわかりました。今シーズンの前半、スプリットを武器にMLBで田中将大が大活躍したように、MLB選手に対して縦に変化する球は、特に効果的である可能性があります。さらにもうひとつ注目すべき結果は、内角低めのカーブが共通して有効である点でしょうか。右投手がこの球を投じるには相当のコントロールを有しますが、うまく決まれば三振を高確率で奪える決め球となりそうです。

 このように今回はアルトゥーベがバレンティン、マートン、ルナと同じような得意コースを有していると仮定して有効な配球を予測しましたが、この結果はアルトゥーベだけに限らず、その他のMLB選手、あるいはNPBの選手から三振を奪うことを考えた場合にも適用できる結果となっています。右投手対右打者の対決の際には今回の結果を頭の片隅に置きながら展開を見守っていただくと、新しい試合の楽しみ方ができるのではないでしょうか。

3 さいごに

 株式会社スタージェンは、野球ビックデータ時代の先端を走ることを目標に、今回はTextilePlotを用いてデータを俯瞰的に眺め、予測モデルの一例として三振確率のモデル化をご紹介しました。ただし、ここで構築したモデルは三振を説明するモデルとしてはまだ完全ではないでしょう。2ストライクのカウントになるまでの投球内容も影響しているでしょうし、その他の要因を考慮すべきかもしれません。しかし視覚的にデータを確認してきたように、考慮した3つの要因は三振との関連が疑われるものばかりですので、このモデルでも十分、三振という現象の一端を捉えていると考えてよいのではないでしょうか。
 野球ビックデータは試合ごとに蓄積され、その量は膨大となってきていますが、その価値のすべてを活用できているとはいえません。野球ビックデータをより輝かせるために、これからもさまざまな角度から解析を進めていく予定でおります。

執筆者紹介

菅谷 勇樹
理学博士(慶應義塾大学)。慶應義塾大学で、柴田里程理工学部前教授、現名誉教授の下、データサイエンスを学ぶ。2010年、株式会社スタージェン入社。遺伝統計解析事業部に所属し、ゲノムデータ、臨床データなどのデータ解析業務に携わる。専門はデータサイエンス・遺伝統計学。