野球における不確実性を考える “被BABIPについて”
Student [ 著者コラム一覧 ]
1.はじめに
前回は野球における“運”の指標としてBABIP(Batting Average on Balls In Play)について解説と分析をしてみました。結果は,データを見る限り運の性質を反映しているとは言い難いものでした。
今回は投手のBABIPである被BABIPを同様に分析してみたいと思います。基本的な算出方法はそんなに変わらないので大きく結果が異なるとは思えませんが,ひとつやってみたいと思います。
とはいえ,打者のBABIPと投手の被BABIPにも違いがあります。打者の場合は打球の処理をするのは相手チームの守備陣です。交流戦も含めると,打者は11チームの守備陣が打球の処理をすることになります。一方,投手の場合は自軍の守備陣が打球を処理します。したがって,被BABIPの方が打球を処理するメンバーがBABIPと比較して固定的になっていることは一応考慮しておいた方が良いかもしれません。
では,今回も被BABIPが運の要素を反映した指標であれば,データにはこのような傾向が現れるだろうという形式で分析して行きたいと思います。
2.データ分析
分析対象者は2006~2010年までのNPB12球団の野手で年間投球回数が10回以上の記録がある選手1195名です。
まずはこの選手たちの投球回数と被BABIPのデータに着目して行きたいと思います。
以下の表1は各選手の投球回数を25回ずつ区切ったもので,各投球回数に該当する選手数を示したものです。

次に,同じように被BABIPの成績を区切って分類したものを表2に示します。

この表1と表2を掛け合わせたデータを表3-1に示します。

この表より投球回別に被BABIPがどの程度の選手が何人いるかがわかります。
さて,「被BABIPが運の要素を反映した指標である」という前提が正しいのであれば,このデータには以下のような特徴が見られるはずです。
・投球回数の少ない選手は,被BABIPが平均 .300より極端に高いか低い選手が多い
・投球回数の多い選手は,被BABIPが平均である .300前後の選手が多い
表3-1のデータでは投球回数ごとに選手数が違うので割合で示したものを表3-2に示します。

表中の赤枠で囲った部分が平均 .300前後の成績を示しており,水色で囲った部分は被BABIPが極端に高いか低い成績であることを示しています。つまり,水色の枠で囲った部分では投球回数が多いほど選手の割合が少なくなり,赤枠で囲った部分では,投球回数が増えるほど選手の割合が増えることになります。
表3-2の中で選手の割合が10%を越えた箇所に色をつけたものを表3-3に示します。

このデータを見るに,選手の分布が被BABIPの平均 .300を中心に均等になっていないことが目立ちます。全体的に被BABIPの平均 .300以下の選手の割合が多くなっています。また,投球回数が増えるほど平均前後の選手が増えるというよりは,投球回数が100回を越えると被BABIPの平均 .300以下の選手の割合が多くなっています。
以上の結果より,被BABIPもBABIP同様に運の性質を反映した指標とはいえない結果となっています。といった感じで結論を出してしまいましたが,もう少し被BABIPの特徴について分析してみたいと思います。
・被BABIPとDER(Defense Efficacy Ratio)の関係
被BABIPの性質を見ていく上で,DERとの関係を無視することはできません。蛭川氏も指摘されていますが,この2つの指標は非常に似た性質を持っています。
以下の図1に2006年から2010年までのNPB12球団の各チーム,計60チーム分の被BABIPとDERの関係を示します。

この2つの指標の類似性は非常に高く,図中に示した相関係数は -.967となっています。この値は非常に相関性で,野球のデータを分析していてこのレベルの相関は,OPSと得点の関係以外に見たことはありません。
これくらい強い相関関係があるということは,同じものを前から見たものをDERと呼んで,後ろから見たものを被BABIPと呼んでいるようなものです。同じものを一方は「守備力」と見なし,一方は「運」とみなすというのはおかしな話であって,どちらかが間違っている可能性が考えられます。
・個人の被BABIPとチームの被BABIPの関係
さらに,被BABIPにはもう一つ特徴があります。投手個人の被BABIPがチーム全体の被BABIPと相関するという性質です。
本来,投手個人に影響した“運”の善し悪しと,チーム全体の“運”の善し悪しとは無関係になるはずです。チーム全体の成績には,他の投手の運の善し悪しも加味されるからです。
ただし,年間の投球回数が増えれば増えるほど,チーム全体にその個人の運が占める割合は増えるわけですが,2006年から2010年までに最も多い投球回数で200回超になります。これだけ投げて,だいたいチームの約1割ですので,やはり個人の運はチーム全体には反映されにくくなっているといって良いと思います。
分析対象の選手の個人の被BABIPと所属チームの被BABIPとの相関を求めると,相関係数は .213になります。これは相関関係としては弱いレベルです。しかし,投球回数別に選手を分類して,それぞれ個人の被BABIPと所属チームの被BABIPとの相関を求めたものを表4に示します。

投球回数が増えるほど,個人の被BABIPと所属チームの被BABIPとの相関関係が強くなっていくのがわかると思います。ここで,チームの被BABIPとDERがほとんど同じ意味を持つことを考えれば,このデータは,投球回数が増えれば増えるほど,投手個人の被BABIPはチームの守備力によって左右されると解釈しても良いのかもしれません。
3.まとめ
以上,BABIPに続いて被BABIPについても分析してみました。被BABIPについても運を反映した指標とはいえない結果であると思います。前回のコラムとあわせて個人的な見解をまとめれば以下のようになります。
BABIPはある程度の運を測定している(全く的外れな指標ではないと思う)。しかし,不純物としての「運以外の要素」が大きいので「運の指標」として信頼できるレベルには達していない。今後は,BABIPの改良,または別のアプローチから運を評価する指標が必要だと思う。
4.セイバーメトリクスとのつきあい方
以上,2度に渡ってBABIPに関する分析と考察をしてきましたが,これを通じてセイバーメトリクス自体の持つ性質が見えてきます。それは何かというと,「セイバーメトリクスは更新し得る」ということです。極端なことをいえば,今日の是が明日は非になり,今日の非が明日の是になることだってあり得ます。
ですから,新しいセイバーメトリクスの指標が開発されても,それは絶対のものではありません。「便利なものができたものだ」と感心しつつも「本当にこれで完璧だろうか?もっと良いものにすることはできないだろうか?」という批判的な目も同時に持つことが,セイバーメトリクスとの上手なつきあい方だと思います。
参考コラム
BASEBALL LABより,蛭川皓平氏のコラム
・BATTING AVERAGE ON BALLS IN PLAY ~Part 1
・BATTING AVERAGE ON BALLS IN PLAY ~Part 2
前回は野球における“運”の指標としてBABIP(Batting Average on Balls In Play)について解説と分析をしてみました。結果は,データを見る限り運の性質を反映しているとは言い難いものでした。
今回は投手のBABIPである被BABIPを同様に分析してみたいと思います。基本的な算出方法はそんなに変わらないので大きく結果が異なるとは思えませんが,ひとつやってみたいと思います。
とはいえ,打者のBABIPと投手の被BABIPにも違いがあります。打者の場合は打球の処理をするのは相手チームの守備陣です。交流戦も含めると,打者は11チームの守備陣が打球の処理をすることになります。一方,投手の場合は自軍の守備陣が打球を処理します。したがって,被BABIPの方が打球を処理するメンバーがBABIPと比較して固定的になっていることは一応考慮しておいた方が良いかもしれません。
では,今回も被BABIPが運の要素を反映した指標であれば,データにはこのような傾向が現れるだろうという形式で分析して行きたいと思います。
2.データ分析
分析対象者は2006~2010年までのNPB12球団の野手で年間投球回数が10回以上の記録がある選手1195名です。
まずはこの選手たちの投球回数と被BABIPのデータに着目して行きたいと思います。
以下の表1は各選手の投球回数を25回ずつ区切ったもので,各投球回数に該当する選手数を示したものです。

次に,同じように被BABIPの成績を区切って分類したものを表2に示します。

この表1と表2を掛け合わせたデータを表3-1に示します。

この表より投球回別に被BABIPがどの程度の選手が何人いるかがわかります。
さて,「被BABIPが運の要素を反映した指標である」という前提が正しいのであれば,このデータには以下のような特徴が見られるはずです。
・投球回数の少ない選手は,被BABIPが平均 .300より極端に高いか低い選手が多い
・投球回数の多い選手は,被BABIPが平均である .300前後の選手が多い
表3-1のデータでは投球回数ごとに選手数が違うので割合で示したものを表3-2に示します。

表中の赤枠で囲った部分が平均 .300前後の成績を示しており,水色で囲った部分は被BABIPが極端に高いか低い成績であることを示しています。つまり,水色の枠で囲った部分では投球回数が多いほど選手の割合が少なくなり,赤枠で囲った部分では,投球回数が増えるほど選手の割合が増えることになります。
表3-2の中で選手の割合が10%を越えた箇所に色をつけたものを表3-3に示します。

このデータを見るに,選手の分布が被BABIPの平均 .300を中心に均等になっていないことが目立ちます。全体的に被BABIPの平均 .300以下の選手の割合が多くなっています。また,投球回数が増えるほど平均前後の選手が増えるというよりは,投球回数が100回を越えると被BABIPの平均 .300以下の選手の割合が多くなっています。
以上の結果より,被BABIPもBABIP同様に運の性質を反映した指標とはいえない結果となっています。といった感じで結論を出してしまいましたが,もう少し被BABIPの特徴について分析してみたいと思います。
・被BABIPとDER(Defense Efficacy Ratio)の関係
被BABIPの性質を見ていく上で,DERとの関係を無視することはできません。蛭川氏も指摘されていますが,この2つの指標は非常に似た性質を持っています。
以下の図1に2006年から2010年までのNPB12球団の各チーム,計60チーム分の被BABIPとDERの関係を示します。

この2つの指標の類似性は非常に高く,図中に示した相関係数は -.967となっています。この値は非常に相関性で,野球のデータを分析していてこのレベルの相関は,OPSと得点の関係以外に見たことはありません。
これくらい強い相関関係があるということは,同じものを前から見たものをDERと呼んで,後ろから見たものを被BABIPと呼んでいるようなものです。同じものを一方は「守備力」と見なし,一方は「運」とみなすというのはおかしな話であって,どちらかが間違っている可能性が考えられます。
・個人の被BABIPとチームの被BABIPの関係
さらに,被BABIPにはもう一つ特徴があります。投手個人の被BABIPがチーム全体の被BABIPと相関するという性質です。
本来,投手個人に影響した“運”の善し悪しと,チーム全体の“運”の善し悪しとは無関係になるはずです。チーム全体の成績には,他の投手の運の善し悪しも加味されるからです。
ただし,年間の投球回数が増えれば増えるほど,チーム全体にその個人の運が占める割合は増えるわけですが,2006年から2010年までに最も多い投球回数で200回超になります。これだけ投げて,だいたいチームの約1割ですので,やはり個人の運はチーム全体には反映されにくくなっているといって良いと思います。
分析対象の選手の個人の被BABIPと所属チームの被BABIPとの相関を求めると,相関係数は .213になります。これは相関関係としては弱いレベルです。しかし,投球回数別に選手を分類して,それぞれ個人の被BABIPと所属チームの被BABIPとの相関を求めたものを表4に示します。

投球回数が増えるほど,個人の被BABIPと所属チームの被BABIPとの相関関係が強くなっていくのがわかると思います。ここで,チームの被BABIPとDERがほとんど同じ意味を持つことを考えれば,このデータは,投球回数が増えれば増えるほど,投手個人の被BABIPはチームの守備力によって左右されると解釈しても良いのかもしれません。
3.まとめ
以上,BABIPに続いて被BABIPについても分析してみました。被BABIPについても運を反映した指標とはいえない結果であると思います。前回のコラムとあわせて個人的な見解をまとめれば以下のようになります。
BABIPはある程度の運を測定している(全く的外れな指標ではないと思う)。しかし,不純物としての「運以外の要素」が大きいので「運の指標」として信頼できるレベルには達していない。今後は,BABIPの改良,または別のアプローチから運を評価する指標が必要だと思う。
4.セイバーメトリクスとのつきあい方
以上,2度に渡ってBABIPに関する分析と考察をしてきましたが,これを通じてセイバーメトリクス自体の持つ性質が見えてきます。それは何かというと,「セイバーメトリクスは更新し得る」ということです。極端なことをいえば,今日の是が明日は非になり,今日の非が明日の是になることだってあり得ます。
ですから,新しいセイバーメトリクスの指標が開発されても,それは絶対のものではありません。「便利なものができたものだ」と感心しつつも「本当にこれで完璧だろうか?もっと良いものにすることはできないだろうか?」という批判的な目も同時に持つことが,セイバーメトリクスとの上手なつきあい方だと思います。
参考コラム
BASEBALL LABより,蛭川皓平氏のコラム
・BATTING AVERAGE ON BALLS IN PLAY ~Part 1
・BATTING AVERAGE ON BALLS IN PLAY ~Part 2
Baseball Lab「Archives」とは?
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
月別著者コラム
最新コラムコメント
|
|
|
|
|
コメント