審判の偏り
時光順平 [ 著者コラム一覧 ]
1.審判に偏りはあるのか
プロ野球をテレビで観戦している時に「なぜ今の球がボールなのか」、「今のボールはストライクだ」などと審判のストライクとボールの判定に疑問を持つ時が多々あると思う。人間が判断することなので多少の偏りはあるだろう。そこで、今回審判に偏りがあるのかを統計的に見ていこうと思う。
審判に最も偏りが出てくるのは、おそらく四球と見逃し三振であろう。今回は審判のストライクゾーンを見極めるために、見逃し三振を題材に検討していこうと思う。見逃し三振は、打者が手を出せなかった、あるいはボールと思って見送った投球に対して審判がストライクと判断して記録される。審判の偏りについて考えるには適した記録といえるだろう。
2.平均から見る審判の偏り
まず、簡単に審判の平均から、偏りがあるのかを見ていこう。使用するデータは、審判の過去5年間の成績である。過去5年間で主審を務めた審判の数は、50人である。まず見ていくデータは、「1から各審判の見逃し三振率をリーグの見逃し三振率で割った値を引いた値」である。そのデータを表2.1と表2.2に示した。値が0に近ければ平均的であることになる。0より低いと見逃し三振率が平均より高く、0より小さいと平均より見逃し三振率が大きいことになる。


審判によっては見逃し三振を多く取る年もあれば少なく取る年もある。これだけを見ると偏りがありそうだが、本当に審判によって偏りがあるか。そこで、統計的に偏りがあるかを分析していき検証していこうと思う。
3.偏りがあるかを検証
まず審判全体に偏りがあるのかを検証していこう。ここでの検証方法は、分散分析といわれるものである。分散分析とは観測データの変動や誤差変動から、要因や交互作用を判定する分析方法である。今回分析する対象の審判は、過去5年または4年間主審を務めた審判38人である。
対象審判38人の1試合当たりの平均見逃し三振率を求め、審判を見逃し三振率が低い順に並べる。 そして、今回はそれらを7つの群にして分析を進めていく。それぞれの群の審判と、各審判の平均見逃し三振率は表3.1である。

これらのデータを分散分析にかけると、以下のような結果が出た。

表3.2のP値に注目して頂きたい。P値の値が小さければ、偏りがあるということになるが、今回の分析結果では、P値が1.144E-20と極めて小さい値となっている。つまり、P値が低いため、審判の間になんらかの偏りがあるのではないかと考えられる。
それでは、どの審判群に偏りがあるかを見ていこう。ここでの検証方法は、ダネットの方法と呼ばれるものである。ダネットの方法とは、仮説検定の一種であり、対照群と処理群の平均に差があるかを検定する時に用いられる検定方法である。
対照群は、今回7つの群に分けた真ん中の第4群とする。処理群は、第4群以外の群となる。つまり、第4群を審判の平均とし、他の群と第4群に差があるのかを検証していく。仮説検定なので、仮説を立てなければ検証出来ないが、今回の仮説は
「第4群の1試合当たりの平均見逃し三振率と、各群の1試合当たりの平均見逃し三振率は変わらない。」
とした。
では、この仮説が正しいかを検証していこう。まず、これから出てくる専門的な言葉の説明をしていく。
・分散・・・平均とのばらつきを表す。この値が小さいほど、平均とのばらつきが少ないことを表す。
・誤差分散・・・誤差がどのくらいばらついているのかを表す値。
・誤差自由度・・・誤差を求める際に必要なデータ数。
・統計量・・・平均や分散などを用いて算出した数値。
・有意水準・・・仮説を棄却するかどうかの判断の基準。
・棄却限界値(棄却域)・・・統計量により、仮説を棄却するかどうかを判断する値や範囲。主に有意水準から算出する。
・両側検定・・・ある範囲から大きすぎても、小さすぎてもいけない場合に使用する基準。
まず、各群の平均、分散、誤差分散を求めていき次に、誤差自由度を求める。各群の平均、分散、誤差分散、誤差自由度は表3.3である。

ここから、各群の統計量を求めていき、棄却限界値と比べて、仮説が棄却されるかどうかを判断する。今回の棄却限界値は、約2.64であった。各群の統計量と結果は、表3.4である。

今回は平均見逃し三振率に差がないということを検証するので、両側検定を用いる。そのため、統計量の絶対値と棄却限界値を比べる。表3.4から、第1群、第2群、第7群が棄却される。よって、第1群、第2群、第7群の審判に偏りがあることが分かった。
では、どのような偏りがあるかを見ていこう。野手が打席に立つ場合に、左投手・右投手により打率に差があるように、審判にも左投手・右投手で差があるのではと考えた。そこで今回検証していく偏りは、第1群、第2群、第7群の審判の左投手と右投手での1試合当たりの見逃し三振率は等しいかどうかである。
ここでも仮説検定を行って検証をしていく。今回用いるのは、等平均検定という方法である。これは、2つの標本の平均(ここでは右投手と左投手)に差があるかを検証する方法になる。先ほどと同様にまず、仮説を立てなければならないが、今回の仮説は
「各群審判の左投手の平均見逃し三振率と、右投手の平均見逃し三振率は等しい」
とした。
この仮説が正しいかどうかを検証していく。まず、各群の左投手と右投手の1試合当たりの平均見逃し三振率から、平均や分散、データ数を求める。各群の値は、表3.5である。

表3.5から統計量と棄却域を求める。棄却域とは、先ほどの棄却限界値と同じようなものであり、有意水準から求めることが出来る。各群の統計量と棄却域は表3.6である。

表3.6を見ると、第1群と第7群では棄却されなかったが、第2群は棄却された。つまり、第2群の審判の偏りは、左投手・右投手によるものであるということが分かった。第1群、第7群は、ここでは偏りが見られなかったため、他に偏りがあるということになる。
4.この検定の信頼性
今回行った検定にはすべて有意水準というものを設定している。有意水準とは、例えば有意水準を5%と設定すると20回に1回結論が誤ってしまうことである。今回の検定もすべて有意水準5%で行っている。つまり、今回の検定の信頼性は高いと言って良いだろう。
ストライクやボールを判断は人間が行うことなので、人によって偏りが出てくることは当然ある。しかし、審判もプロであるため出来るだけ偏りのないジャッジが必要となるであろう。今回、どのような偏りがあるかは発見出来なかったが、ただ見逃し三振が多いのか、それとも何かしらの原因があるのか今後も分析していきたいと思う。
プロ野球をテレビで観戦している時に「なぜ今の球がボールなのか」、「今のボールはストライクだ」などと審判のストライクとボールの判定に疑問を持つ時が多々あると思う。人間が判断することなので多少の偏りはあるだろう。そこで、今回審判に偏りがあるのかを統計的に見ていこうと思う。
審判に最も偏りが出てくるのは、おそらく四球と見逃し三振であろう。今回は審判のストライクゾーンを見極めるために、見逃し三振を題材に検討していこうと思う。見逃し三振は、打者が手を出せなかった、あるいはボールと思って見送った投球に対して審判がストライクと判断して記録される。審判の偏りについて考えるには適した記録といえるだろう。
2.平均から見る審判の偏り
まず、簡単に審判の平均から、偏りがあるのかを見ていこう。使用するデータは、審判の過去5年間の成績である。過去5年間で主審を務めた審判の数は、50人である。まず見ていくデータは、「1から各審判の見逃し三振率をリーグの見逃し三振率で割った値を引いた値」である。そのデータを表2.1と表2.2に示した。値が0に近ければ平均的であることになる。0より低いと見逃し三振率が平均より高く、0より小さいと平均より見逃し三振率が大きいことになる。


審判によっては見逃し三振を多く取る年もあれば少なく取る年もある。これだけを見ると偏りがありそうだが、本当に審判によって偏りがあるか。そこで、統計的に偏りがあるかを分析していき検証していこうと思う。
3.偏りがあるかを検証
まず審判全体に偏りがあるのかを検証していこう。ここでの検証方法は、分散分析といわれるものである。分散分析とは観測データの変動や誤差変動から、要因や交互作用を判定する分析方法である。今回分析する対象の審判は、過去5年または4年間主審を務めた審判38人である。
対象審判38人の1試合当たりの平均見逃し三振率を求め、審判を見逃し三振率が低い順に並べる。 そして、今回はそれらを7つの群にして分析を進めていく。それぞれの群の審判と、各審判の平均見逃し三振率は表3.1である。

これらのデータを分散分析にかけると、以下のような結果が出た。

表3.2のP値に注目して頂きたい。P値の値が小さければ、偏りがあるということになるが、今回の分析結果では、P値が1.144E-20と極めて小さい値となっている。つまり、P値が低いため、審判の間になんらかの偏りがあるのではないかと考えられる。
それでは、どの審判群に偏りがあるかを見ていこう。ここでの検証方法は、ダネットの方法と呼ばれるものである。ダネットの方法とは、仮説検定の一種であり、対照群と処理群の平均に差があるかを検定する時に用いられる検定方法である。
対照群は、今回7つの群に分けた真ん中の第4群とする。処理群は、第4群以外の群となる。つまり、第4群を審判の平均とし、他の群と第4群に差があるのかを検証していく。仮説検定なので、仮説を立てなければ検証出来ないが、今回の仮説は
「第4群の1試合当たりの平均見逃し三振率と、各群の1試合当たりの平均見逃し三振率は変わらない。」
とした。
では、この仮説が正しいかを検証していこう。まず、これから出てくる専門的な言葉の説明をしていく。
・分散・・・平均とのばらつきを表す。この値が小さいほど、平均とのばらつきが少ないことを表す。
・誤差分散・・・誤差がどのくらいばらついているのかを表す値。
・誤差自由度・・・誤差を求める際に必要なデータ数。
・統計量・・・平均や分散などを用いて算出した数値。
・有意水準・・・仮説を棄却するかどうかの判断の基準。
・棄却限界値(棄却域)・・・統計量により、仮説を棄却するかどうかを判断する値や範囲。主に有意水準から算出する。
・両側検定・・・ある範囲から大きすぎても、小さすぎてもいけない場合に使用する基準。
まず、各群の平均、分散、誤差分散を求めていき次に、誤差自由度を求める。各群の平均、分散、誤差分散、誤差自由度は表3.3である。

ここから、各群の統計量を求めていき、棄却限界値と比べて、仮説が棄却されるかどうかを判断する。今回の棄却限界値は、約2.64であった。各群の統計量と結果は、表3.4である。

今回は平均見逃し三振率に差がないということを検証するので、両側検定を用いる。そのため、統計量の絶対値と棄却限界値を比べる。表3.4から、第1群、第2群、第7群が棄却される。よって、第1群、第2群、第7群の審判に偏りがあることが分かった。
では、どのような偏りがあるかを見ていこう。野手が打席に立つ場合に、左投手・右投手により打率に差があるように、審判にも左投手・右投手で差があるのではと考えた。そこで今回検証していく偏りは、第1群、第2群、第7群の審判の左投手と右投手での1試合当たりの見逃し三振率は等しいかどうかである。
ここでも仮説検定を行って検証をしていく。今回用いるのは、等平均検定という方法である。これは、2つの標本の平均(ここでは右投手と左投手)に差があるかを検証する方法になる。先ほどと同様にまず、仮説を立てなければならないが、今回の仮説は
「各群審判の左投手の平均見逃し三振率と、右投手の平均見逃し三振率は等しい」
とした。
この仮説が正しいかどうかを検証していく。まず、各群の左投手と右投手の1試合当たりの平均見逃し三振率から、平均や分散、データ数を求める。各群の値は、表3.5である。

表3.5から統計量と棄却域を求める。棄却域とは、先ほどの棄却限界値と同じようなものであり、有意水準から求めることが出来る。各群の統計量と棄却域は表3.6である。

表3.6を見ると、第1群と第7群では棄却されなかったが、第2群は棄却された。つまり、第2群の審判の偏りは、左投手・右投手によるものであるということが分かった。第1群、第7群は、ここでは偏りが見られなかったため、他に偏りがあるということになる。
4.この検定の信頼性
今回行った検定にはすべて有意水準というものを設定している。有意水準とは、例えば有意水準を5%と設定すると20回に1回結論が誤ってしまうことである。今回の検定もすべて有意水準5%で行っている。つまり、今回の検定の信頼性は高いと言って良いだろう。
ストライクやボールを判断は人間が行うことなので、人によって偏りが出てくることは当然ある。しかし、審判もプロであるため出来るだけ偏りのないジャッジが必要となるであろう。今回、どのような偏りがあるかは発見出来なかったが、ただ見逃し三振が多いのか、それとも何かしらの原因があるのか今後も分析していきたいと思う。
Baseball Lab「Archives」とは?
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
月別著者コラム
最新コラムコメント
|
|
|
|
|
コメント