HOME > コラム一覧 > コラム

コラム

野球における不確実性を考える

Student [ 著者コラム一覧 ]

投稿日時:2011/08/03(水) 10:00rss

1.はじめに
 
 今回は久しぶりにデータの性質について解説したいと思います。
 
 芯で捉えた打球が野手の正面に飛んでアウトになったり,ボテボテの打ちそこないが野手の間を抜けてヒットになったりする光景は,野球を見ているとしばしばあることです。
 
 打者は,右・左・センター方向といった大雑把な方向や,転がすか打ち上げるかといったことは狙うことができても,細かい位置までは狙うことはできません。したがって,先に紹介したような,打球がヒットになるかアウトになるかどうかということには,投手も打者も野手もどうすることもできない部分があるといってよいでしょう。
 
 このような,野球においてプレーしている選手にはコントロールできない不確実な部分を,今回は“運”と呼ぶことにします。偶然性と呼んでも構わないし,不確実性と呼ぶとなんだか格好が良い気もしますが,そこは気取らず“運”と呼んでいくことにします。
 
 重要なのはこの“運”の名前ではなく,これが野球をプレーしている全ての選手に影響しているということです。つまり,記録として残っている選手の成績には,本人の能力に加えて大なり小なり運の影響を受けているということです。このイメージを数式に表すと,
 
成績 = 選手の持っている能力 ± 運
 
 と,なります。運が成績を向上させるようにプラスに働けばその選手は幸運といえます。一方,運が成績を低下させるようマイナスに作用している選手は不運な選手といえるでしょう。このような運の影響をなぜ想定する必要があるかというと,成績だけを見ていると幸運な選手を過大評価して,不運な選手を過小評価してしまう可能性があるからです。
 
 
2.運の性質を知ろう
 
 さて,“運”とはプレーしている選手にはコントロールできないとはいいましたが,“運”自体には性質があります。この運の性質を理解すれば,運によって選手を過大や過小に評価してしまうことを防ぐことができるかもしれません。
 
以下,運の性質についてあげていきます。
 
・あまりにも極端な幸運・不運はめったにおこらない。
幸運がもたらされるか不運がもたらされるかはランダムなので,幸運や不運の影響が偏るにしても限度があるということです。しかし,逆をいえばごく稀にではあるが,非常に幸運な選手や不運な選手が現れるということです。めったに現れないからといって,そういう選手が存在しないわけではないので注意が必要です。
 
・短い期間,少ないデータでは極端な幸運・不運が起こりやすい。
 これは一つ目の特徴と一見矛盾するようですが,サイコロを6回振って全ての目が一度ずつ出ることが稀なようにデータ数が少ないと極端な結果になりがちです。トーナメント戦やポストシーズンなど短期決戦で,大活躍する選手や,不振に陥る選手をイメージしていただければよいと思います。
 
・長い期間,大量のデータでは幸運と不運の影響は互いに相殺されて,運の影響は0に近づく。
さて,短い期間であれば偏り得る運の影響も,長期間になると結局は幸運と不運の影響は相殺されてしまいます。ポストシーズンで大活躍した選手が翌シーズンはそれほど活躍しなかったり,シーズン序盤は不調に苦しんでいても終わってみれば例年並みの成績を残した選手などがこれにあたります。
 
 
3.運の影響を計算してみる
 
 運の性質を紹介しましたが,要するに選手は参加したゲームの数によって受ける運の影響がことなってくるということです。では,実際にどのくらい運によって左右されるか,打率を例にとって計算してみたいと思います。
 
 例として計算するために,持っている能力が打率.300の選手を仮定します。この選手の成績が運によってどれくらい左右されるかを検証していきます。
 
 計算方法は「メジャーリーグの数理科学」にも紹介されていた古典的な「野球ゲーム」による方法を用います。もったいぶった言い方をしましたが,要は図1に示したような,ルーレットを回すというものです。
 

 
 実際の打者の成績は,身体的・精神的なコンディションの影響も受けるので,このように単純に結果が出るわけではありませんが,技術的にも身体的・精神的なコンディションにも問題がない状態であっても,どの程度運によって左右されるかという理論的な範囲を知っておくことで選手の成績を見ていく上での参考になればと思います。
 
では,円を10等分して,仮定している打率が.300なので3つをヒットの目にします。このルーレットを200回まわしたとき,ヒットが何回出るかという確率を計算すると以下の図2-1のようになります。
 

 
 この図から,打率.300のところがピークなので,最もなりやすい結果は能力通りの打率であるといえます。しかし,この確率も約6%ですので,能力通りの結果にならない確率の方が高いといえます。
 
 次に,ヒットの数が0や200,つまり打率が.000や1.000以上になる確率は極めて0に近くなっているということです。打率.300に近づくほどこの確率は高くなっていきます。
 
 まとめると,確率的に見れば能力通り結果にならない確率が高い。そして,極端な低打率や高打率になる確率も低く,能力前後の結果になる確率が高いということになります。
 
 では,どのくらいの打率になれば,極端な低打率や高打率といえるのでしょうか?これに答えはないのですが,一応の基準として統計学では信頼区間という範囲を設定します。イメージとしては図2-2に示しているような感じです。
 

 
 ピークである打率3割を中心に上限下限を決めるわけです。この上限と下限の基準の設定には,甘めにするか厳しめにするかといった判断が必要で,計算方法も込み入ってくるので今回は割愛します。
 
今回は仮にこの基準を上限下限とも累積2.5%のラインに設定してみました。信頼区間の範囲になる確率が95%程度になるように設定しました。この基準で打数が変化したときの信頼区間の範囲を表1に示します。
 

 
 打数が増えるごとに範囲が狭くなっているのがわかると思います。打率.300の能力を持っていたとしても,100打数しかチャンスがなければ打率は.100前後も左右されてしまうこと,600打数あっても.030程度は左右されることがわかります。
 
※この範囲は元の打率によっても左右されます。全ての選手に当てはまる範囲ではないのであくまで目安としてご覧ください。
 
 
4.どこまでが運なのか?
 
 以上,運によってどれくらい打率が左右されるかを試算してみました。あくまで理論的な試算であることには注意してください。
 
 また,今回は選手の持っている能力を打率.300と仮定しましたが,実際には運に左右された部分を除いた選手の能力を正確に測定する方法はありません。測定ができないのであれば推定するしかないのですが,そこにはまた工夫が必要です。
 
 とはいえ,こうした理論的に示された運によって左右される範囲のデータがあれば,特定選手の年間成績の変動を見たり,選手のコンディションに問題があるのか一過的な不運なのかを考える際の手助けになると思います。
 
 最後に重要なことなのですが,今の段階では人間にはコントロールできないから“運”と考えているものの中には,実はまだ気がついていないだけで,何らかのコントロールができる要素がある可能性があります。したがって,運の影響を考慮しつつも,本当にそれは運によるものかと考える姿勢も同時に重要になります。
 

コメント


確率密度と確率をごっちゃにしすぎじゃナイですか

Posted by a at 2012/09/10 09:46:39 PASS:
名前:
メールアドレス:
コメント:
評価:
star2.gif star2.gif star2.gif star2.gif star2.gif
d9ebeacf599c099f5f4b9b5d9beab573.png?1503133501
画像の英字5文字を入力して下さい。:

トラックバック一覧

Baseball Lab「Archives」とは?
 
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。

野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。