審判の偏り~Part3
時光順平 [ 著者コラム一覧 ]
1.はじめに
前回、前々回と2回にわたって審判の見逃し三振に対する偏り検証していった。審判を7つの群に分け、それぞれの群に偏りがあるかどうかを見ていった。結果は、3つの群に偏りがあることが分かり、それがどのような偏りであるかも分かった。
今回は審判間に、偏りが出そうなもう1つの指標である、四球について分析をしていく。四球も見逃し三振と同様に偏りが出てくるのかみていこう。
2.平均から見る偏り
見逃し三振のときと同様にまず、簡単に審判の平均から、偏りがあるのかを見ていこう。使用するデータは、審判の過去5年間の成績である。過去5年間で主審を務めた審判の数は、50人である。まず見ていくデータは、「1から各審判の四球率をリーグの四球率で割った値を引いた値」である。そのデータを表2.1と表2.2に示した。値が0に近ければ平均的であることになる。0より低いと四球率が平均より高く、0より小さいと平均より四球率が大きいことになる。


見逃し三振の時と同様に、各年によって平均より四球を多くとる審判もいれば、平均より少なく四球をとる審判もいることが分かる。では、四球による偏りはあるのだろうか。見逃し三振のときと同じように、まず分散分析で審判間に偏りがあるかを調べ、偏りがあった場合は、ダネットの方法を使用してどこの群に偏りがあるのかを検証していこう。
3.偏りを検証
今回対象となる審判は、過去5年または、4年間主審を務めた審判38人である。その38人の審判の平均四球率を算出し、それを低い順に並べていく。そして、今回もそれらを7つの群に分けて分析を進めていく。それぞれの群の審判と、各審判の四球率は表3.1である。

これらのデータを分散分析にかけるとP-値が6.84E-12と極めて小さい数値となった。つまり、四球における審判間に何らかの偏りがあるのではないかということになる。
では、ダネットの方法を使用してどの群に偏りがあるかを検証する。仮説検定であるためまず仮説を立てる。今回立てた仮説は
「第4群の1試合当たりの平均四球率と、各群の1試合当たりの平均四球率は変わらない。」
である。
この仮説が正しいかを検証する。なお、有意水準は0.05である。各群の統計量とその結果は表3.2である。

表3.2をみると、第1群と第7群が棄却された。つまり、第1群と第7群に何らかの偏りがあることが分かった。
では、第1群と第7群の偏りが何かを分析していこう。見逃し三振の時は、打者の目線からどのような偏りがあるかを考えていった。今回は、試合の流れから偏りがあるのかを考えていこう。今回検証する偏りは、イニングによっての偏りである。試合に序盤・中盤・終盤での、審判の四球の割合に差があるのか検証していく。
そこで、まず分散分析を用いて第1群と第7群に、イニングによっての四球割合に差があるのかを見ていく。今回は、試合を序盤・中盤・終盤と大きく3つに分け、序盤を1回~3回、中盤を4回~7回、終盤を7回以降とした。第1群と第7群のイニング別の四球割合(過去5年間)は、表3.3、表3.4である。


これらのデータを分散分析にかけると以下のような結果が出た。

第1群のP-値は0.566651、第7群のP-値は0.000845である。よって第1群にはイニング間に差がないことが分かり、第7群には、イニング間に差があることが分かった。
では、第7群の偏りについてもう少し深く見ていこう。分散分析の結果、第7群にイニング間の偏りがあることが分かった。では、どこのイニングに偏りがあるのかを検証していこう。ここでの検証方法は、前回コースによっての偏りを検証したときに用いたテューキーの方法である。
今回は、試合の序盤・中盤・終盤3つの群の割合に差があるかを検証していく。今回もコースの時と同様、3つの差を検証するので3つの仮説を立てる。テューキーの方法は、仮説検定なので仮説を立てる。今回立てた仮説は
である。
まず、各イニングの平均、分散と誤差分散と誤差自由度を求める。各イニングの平均、分散および誤差分散と誤差自由度を表3.7に示す。

ここから、統計量を求め棄却限界値と比べて仮説が棄却されるかを判断する。今回の棄却限界値は、3.776であった。統計量とその結果は表3.8である。

表3.8から、中盤-終盤、序盤-終盤が棄却されず、序盤-中盤が棄却された。序盤-中盤の統計量を見ると、プラスの値である。つまり、イニング間では若干序盤(1回~3回)に偏りがあることになる。
では、先ほど発見出来なかった第1群の偏りを検証していこう。見逃し三振では、左投手・右投手、コース、左打者・右打者、の3つについての偏りを検証していった。この3つの偏りは、四球でも偏りがありそうだが、個人的にこの3つの中で左投手・右投手の偏りが1番ありそうだと思った。そこで、四球に関して左投手・右投手に差があるかを見ていこう。
検証方法は、見逃し三振の時と同様に等平均検定である。仮説検定であるため、まず仮説を立てる。仮説は
「第1群審判で左打者1人当たりに対する平均四球数と、右打者1人当たりに対する平均四球数は等しい」
である。
過去5年間の1人の左打者・右打者に対する平均四球数は表3.9である。

これらのデータから平均や分散を用いて統計量を算出し、棄却域と比べて仮説が正しいか判断をする。有意水準は0.05と設定した。統計量とその結果は、表3.10である。

表3.10を見ると、統計量が棄却域内であるため仮説が棄却されることになる。つまり、第1群の偏りは、左投手・右投手によるものということが分かった。この場合、統計量がプラスであるため、左投手に偏りがあることになる。
4.見逃し三振と四球のデータから審判をグループ分け
ここまで、見逃し三振と四球についての審判の偏りを見てきた。これまでは、見逃し三振と四球を別々に見てきたが、今回は2つの指標を同時に見て、審判にどのような傾向があるかを見ていこうと思う。ここでの分析方法は、クラスター分析という統計的手法である。クラスター分析とは、データ間の距離を求め、たくさんのデータをいくつかのグループに分ける方法である。今回用いるデータは、偏りを検証する際に審判を1群から7群まで分けたときに使用したデータを用いる。これらのデータからクラスター分析を行うと以下のような結果になった。

今回は4つのクラスター(グループ)に分かれた。各クラスターの特徴は
第1クラスター・・・見逃し三振は平均より少なく、四球は平均より多い。
第2クラスター・・・見逃し三振・四球ともに平均的。
第3クラスター・・・四球は平均より少なく、見逃し三振は平均より多い。
第4クラスター・・・見逃し三振・四球ともに平均より多い。
となった。
第1クラスターは10人であった。第1クラスターでは、見逃し三振は平均より少なく、四球は平均より多いということは、ストライクゾーンが広い可能性がある。
第2クラスターは13人であった。第2クラスターは、見逃し三振・四球ともに平均的であるため、基準に近い判定を行っていることになる。
第3クラスターは7人であった。第3クラスターは、四球は平均より少なく、見逃し三振は平均より多いため、ストライクゾーンが狭い可能性がある。
第4クラスターは8人であった。第4クラスターは、四球・見逃し三振共に平均より多い。
5.まとめ
四球に関しても見逃し三振と同様に、偏りがあることが分かった。第7群の偏りでは、試合の序盤である1回~3回に偏りが出た。試合の序盤である1回~3回に偏りが出たのは、審判の目が球のスピードに慣れていないためこのような結果が出たのかもしれない。試合の中盤から終盤にかけては段々と目が慣れたため、その差がなかった可能性もある。
第1群の偏りは、左投手・右投手によるものであった。今年から審判は、所属リーグがなくなったが、昨年まではセリーグ・パリーグと分けられていた。第1群の審判は6人中5人がセリーグ所属である。セリーグとパリーグでは、どちらかというとパリーグに良い左投手が多いという印象がある。例えば、ソフトバンクの和田、杉内、ロッテの成瀬などがあげられる。この3人は特に、コントロールも良く見逃し三振は多いであろう。このような偏りがでたのは、パリーグの主審を務めている審判が、見逃し三振を多く取っているのではないかと考えられる。
審判のグループ分けでは、分析する前に4つのグループに分かれるだろうと予測していたがその通り分かれた。監督や選手に特徴があるように、審判にも特徴はある。
今回は、クラスター分析を行い大きく4つのグループに別ける事が出来たが、クラスター分析の場合、例えばクラスターの数をあらかじめ定めておいて分析をする方法など、さまざまな方法がある。クラスター数が多くなればそれだけ細かな特徴が出てくるので、今後も続けていこうと思う。
前回、前々回と2回にわたって審判の見逃し三振に対する偏り検証していった。審判を7つの群に分け、それぞれの群に偏りがあるかどうかを見ていった。結果は、3つの群に偏りがあることが分かり、それがどのような偏りであるかも分かった。
今回は審判間に、偏りが出そうなもう1つの指標である、四球について分析をしていく。四球も見逃し三振と同様に偏りが出てくるのかみていこう。
2.平均から見る偏り
見逃し三振のときと同様にまず、簡単に審判の平均から、偏りがあるのかを見ていこう。使用するデータは、審判の過去5年間の成績である。過去5年間で主審を務めた審判の数は、50人である。まず見ていくデータは、「1から各審判の四球率をリーグの四球率で割った値を引いた値」である。そのデータを表2.1と表2.2に示した。値が0に近ければ平均的であることになる。0より低いと四球率が平均より高く、0より小さいと平均より四球率が大きいことになる。
見逃し三振の時と同様に、各年によって平均より四球を多くとる審判もいれば、平均より少なく四球をとる審判もいることが分かる。では、四球による偏りはあるのだろうか。見逃し三振のときと同じように、まず分散分析で審判間に偏りがあるかを調べ、偏りがあった場合は、ダネットの方法を使用してどこの群に偏りがあるのかを検証していこう。
3.偏りを検証
今回対象となる審判は、過去5年または、4年間主審を務めた審判38人である。その38人の審判の平均四球率を算出し、それを低い順に並べていく。そして、今回もそれらを7つの群に分けて分析を進めていく。それぞれの群の審判と、各審判の四球率は表3.1である。
これらのデータを分散分析にかけるとP-値が6.84E-12と極めて小さい数値となった。つまり、四球における審判間に何らかの偏りがあるのではないかということになる。
では、ダネットの方法を使用してどの群に偏りがあるかを検証する。仮説検定であるためまず仮説を立てる。今回立てた仮説は
「第4群の1試合当たりの平均四球率と、各群の1試合当たりの平均四球率は変わらない。」
である。
この仮説が正しいかを検証する。なお、有意水準は0.05である。各群の統計量とその結果は表3.2である。
表3.2をみると、第1群と第7群が棄却された。つまり、第1群と第7群に何らかの偏りがあることが分かった。
では、第1群と第7群の偏りが何かを分析していこう。見逃し三振の時は、打者の目線からどのような偏りがあるかを考えていった。今回は、試合の流れから偏りがあるのかを考えていこう。今回検証する偏りは、イニングによっての偏りである。試合に序盤・中盤・終盤での、審判の四球の割合に差があるのか検証していく。
そこで、まず分散分析を用いて第1群と第7群に、イニングによっての四球割合に差があるのかを見ていく。今回は、試合を序盤・中盤・終盤と大きく3つに分け、序盤を1回~3回、中盤を4回~7回、終盤を7回以降とした。第1群と第7群のイニング別の四球割合(過去5年間)は、表3.3、表3.4である。
これらのデータを分散分析にかけると以下のような結果が出た。
第1群のP-値は0.566651、第7群のP-値は0.000845である。よって第1群にはイニング間に差がないことが分かり、第7群には、イニング間に差があることが分かった。
では、第7群の偏りについてもう少し深く見ていこう。分散分析の結果、第7群にイニング間の偏りがあることが分かった。では、どこのイニングに偏りがあるのかを検証していこう。ここでの検証方法は、前回コースによっての偏りを検証したときに用いたテューキーの方法である。
今回は、試合の序盤・中盤・終盤3つの群の割合に差があるかを検証していく。今回もコースの時と同様、3つの差を検証するので3つの仮説を立てる。テューキーの方法は、仮説検定なので仮説を立てる。今回立てた仮説は
- 「第7群の序盤の四球割合と中盤の四球割合は等しい」
- 「第7群の中盤の四球割合と終盤の四球割合は等しい」
- 「第7群の序盤の四球割合と終盤の四球割合は等しい」
である。
まず、各イニングの平均、分散と誤差分散と誤差自由度を求める。各イニングの平均、分散および誤差分散と誤差自由度を表3.7に示す。
ここから、統計量を求め棄却限界値と比べて仮説が棄却されるかを判断する。今回の棄却限界値は、3.776であった。統計量とその結果は表3.8である。
表3.8から、中盤-終盤、序盤-終盤が棄却されず、序盤-中盤が棄却された。序盤-中盤の統計量を見ると、プラスの値である。つまり、イニング間では若干序盤(1回~3回)に偏りがあることになる。
では、先ほど発見出来なかった第1群の偏りを検証していこう。見逃し三振では、左投手・右投手、コース、左打者・右打者、の3つについての偏りを検証していった。この3つの偏りは、四球でも偏りがありそうだが、個人的にこの3つの中で左投手・右投手の偏りが1番ありそうだと思った。そこで、四球に関して左投手・右投手に差があるかを見ていこう。
検証方法は、見逃し三振の時と同様に等平均検定である。仮説検定であるため、まず仮説を立てる。仮説は
「第1群審判で左打者1人当たりに対する平均四球数と、右打者1人当たりに対する平均四球数は等しい」
である。
過去5年間の1人の左打者・右打者に対する平均四球数は表3.9である。
これらのデータから平均や分散を用いて統計量を算出し、棄却域と比べて仮説が正しいか判断をする。有意水準は0.05と設定した。統計量とその結果は、表3.10である。
表3.10を見ると、統計量が棄却域内であるため仮説が棄却されることになる。つまり、第1群の偏りは、左投手・右投手によるものということが分かった。この場合、統計量がプラスであるため、左投手に偏りがあることになる。
4.見逃し三振と四球のデータから審判をグループ分け
ここまで、見逃し三振と四球についての審判の偏りを見てきた。これまでは、見逃し三振と四球を別々に見てきたが、今回は2つの指標を同時に見て、審判にどのような傾向があるかを見ていこうと思う。ここでの分析方法は、クラスター分析という統計的手法である。クラスター分析とは、データ間の距離を求め、たくさんのデータをいくつかのグループに分ける方法である。今回用いるデータは、偏りを検証する際に審判を1群から7群まで分けたときに使用したデータを用いる。これらのデータからクラスター分析を行うと以下のような結果になった。
今回は4つのクラスター(グループ)に分かれた。各クラスターの特徴は
第1クラスター・・・見逃し三振は平均より少なく、四球は平均より多い。
第2クラスター・・・見逃し三振・四球ともに平均的。
第3クラスター・・・四球は平均より少なく、見逃し三振は平均より多い。
第4クラスター・・・見逃し三振・四球ともに平均より多い。
となった。
第1クラスターは10人であった。第1クラスターでは、見逃し三振は平均より少なく、四球は平均より多いということは、ストライクゾーンが広い可能性がある。
第2クラスターは13人であった。第2クラスターは、見逃し三振・四球ともに平均的であるため、基準に近い判定を行っていることになる。
第3クラスターは7人であった。第3クラスターは、四球は平均より少なく、見逃し三振は平均より多いため、ストライクゾーンが狭い可能性がある。
第4クラスターは8人であった。第4クラスターは、四球・見逃し三振共に平均より多い。
5.まとめ
四球に関しても見逃し三振と同様に、偏りがあることが分かった。第7群の偏りでは、試合の序盤である1回~3回に偏りが出た。試合の序盤である1回~3回に偏りが出たのは、審判の目が球のスピードに慣れていないためこのような結果が出たのかもしれない。試合の中盤から終盤にかけては段々と目が慣れたため、その差がなかった可能性もある。
第1群の偏りは、左投手・右投手によるものであった。今年から審判は、所属リーグがなくなったが、昨年まではセリーグ・パリーグと分けられていた。第1群の審判は6人中5人がセリーグ所属である。セリーグとパリーグでは、どちらかというとパリーグに良い左投手が多いという印象がある。例えば、ソフトバンクの和田、杉内、ロッテの成瀬などがあげられる。この3人は特に、コントロールも良く見逃し三振は多いであろう。このような偏りがでたのは、パリーグの主審を務めている審判が、見逃し三振を多く取っているのではないかと考えられる。
審判のグループ分けでは、分析する前に4つのグループに分かれるだろうと予測していたがその通り分かれた。監督や選手に特徴があるように、審判にも特徴はある。
今回は、クラスター分析を行い大きく4つのグループに別ける事が出来たが、クラスター分析の場合、例えばクラスターの数をあらかじめ定めておいて分析をする方法など、さまざまな方法がある。クラスター数が多くなればそれだけ細かな特徴が出てくるので、今後も続けていこうと思う。
Baseball Lab「Archives」とは?
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
月別著者コラム
最新コラムコメント
|
|
|
|
|
コメント