リプレイスメント・レベル~Part1
蛭川皓平 [ 著者コラム一覧 ]
1.基準の必要性
野球の成績に限ったことではないが、評価には基準が必要である。記録や成績は単独で意味を持つのではなく、それを取り囲む文脈の中においてはじめて意味を持つ。
同じ「打率.270」でも、リーグの平均打率が.250の場合と.280の場合では意味が異なる。もっと単純に1試合レベルで考えても同様である。チームが5得点をあげても、「5得点」そのものには価値がない。問題は相手の得点との比較であり、相手が4得点以下であれば勝利となり6得点以上であれば敗北となる。比較してはじめて価値が定まる。このように相対的な比較は野球の数字において本質的である。そして、比較にどのような基準を用いるかということが重要な論点になる。
結論から端的に言ってしまえば、評価にどのような基準を用いるべきかはケース・バイ・ケースである。あらゆる場面に通用する単一の比較・評価方法というものはない。その中で、大切なのは可能な選択肢に関してその意味を把握しておくことだろう。
2.平均の問題点
セイバーメトリクスにおける伝統的な評価基準は、平均値であった。たとえば打率なら、リーグの安打数の合計を打数の合計で割ることでリーグの平均打率が計算できる。対象の打者の打率がその平均を上回っていれば優秀とするのが平均との比較の基本的な考え方である。
ピート・パーマーが開発したBatting Runsなどはまさに平均との比較をその内容としている。得点期待値に与える影響が平均的な打者程度である場合をゼロとして、平均より上ならプラス、平均より下ならマイナス評価となる打撃の指標である。
「平均」は、その基準の意味はわかりやすいのだが、一方で平均と比較するだけでは選手の価値がわかりにくいということもある。2人の打者を考えてみよう。片方は年間フル出場しBRが-2、他方は5試合の出場でBRが+1だったとする。この場合、単にBRを比べるだけでは後者のほうが高い評価となる。しかし現実的には、一軍の平均レベルの活躍を年間通して達成する打者というのはそれなりに貴重で価値のあるものである。それを、たった5試合しか出ていない選手と比べて価値が低いと評価することには違和感がある。前者の選手がもしどこかで故障していたら、チームはより能力の劣る控え選手を出場させなければならなかったから成績を落としていただろう。そう考えると、たしかに平均より低い水準であったとしても前者の選手が出場し続けたことには価値があったはずである。
これに関しては打席数も合わせてさまざまな数値を見て考量すればいいだけではないかという意見もあるだろう。しかし、このくらい出場機会が極端に異なる場合は別として、もう少し出場機会や成績の違いが微妙な場合はどちらの選手に価値があるかについて妥当な結論を出すことが難しくなる。「なんとなく」で恣意的に判断することは避けたい。
これに対してある程度明確な答えを提供するために用いられる比較基準に「リプレイスメント・レベル」というものがある。リプレイスメント・レベルはMLBにおいて選手の価値を評価する際に有力な基準とされているものである。NPBでも当然活用することができる考え方であり有用であるため、本記事ではリプレイスメント・レベルについて紹介と検討を行なってみたい。
3.ウールナーのシナリオ
リプレイスメント・レベル論で有名なのはキース・ウールナーという人物である。彼の説いているリプレイスメント・レベルの有効性に関する話がわかりやすく面白いため、それを(長いため簡略化・改変してではあるが)紹介する。
まず、ミスター・アベレージとミスター・フラジールの2人の打者を考える。両者の成績は以下の通りである。
アベレージ : 600打席 打率.260 出塁率.330 長打率.420
フラジール : 100打席 打率.300 出塁率.400 長打率.550
アベレージは安定している代わりにこれといって見応えのない打者であり、フラジールは打線に加わっているときにはMVPレベルの活躍を見せる。
さて、シーズンが終了するまでには各ポジションに600打席の出場が必要であるとする。ここでアベレージはフル出場だから問題ないが、フラジールは体力に問題があり100打席しか出場できなかった。フラジールの守備位置の残り500打席はどうなるだろうか。フラジールの耐久性の問題がシーズン開始前に明らかでなかったとすれば、チームは控えの打者を出場させるなり二軍から適当な選手を上げてくるなりすることになる。余計な代償を支払わずにチームができることはそれくらいだからである。
ここでは、チームは二軍からミスター・バックアップを引き上げてフラジールの代わりに出場させるとする。バックアップには、あまり良い成績は期待できないだろう(だからこそ彼は一軍のレギュラープレーヤーではないのである)。バックアップの成績は打率.225 出塁率.295 長打率.385とする。
このとき重要なのは、ミスター・バックアップと同じような選手は実質的にいくらでもいるということである。彼は何か特別なわけではなく、今回たまたま声がかかったにすぎない。チームは最低限のコストで彼と同じような選手をいつでも用意することができる。これは、野球選手の分布がそもそもそうなっているからである。数少ないスター・プレーヤーと、いくらかの平均的プレーヤーと、数多い控え・二軍レベルのプレーヤー。一軍平均レベルの選手は実際のところ、最小限のコストで用意できるものではない。
さて、アベレージが所属するチームとフラジール&バックアップが所属するチームに分けた場合、それぞれのチームの成績は次のようになる。
アベレージチーム
アベレージ : 600打席 打率.260 出塁率.330 長打率.420 BR 0
フラジール・バックアップチーム
フラジール : 100打席 打率.300 出塁率.400 長打率.550 BR 8
バックアップ: 500打席 打率.225 出塁率.295 長打率.385 BR -15
各人のBRを個別に見る限りでは、フラジールが最も良い選手に見える。しかしシーズン全体として考えると、フラジール&バックアップチームは平均に比べ-7と劣る結果になっている。
こうなることがわかっているとして、あなたがチームの監督なら、アベレージとフラジールのどちらを好むだろうか。出場時の成績だけを見ればフラジールが突出して優れているにも関わらず、好まれるのはアベレージだろう。何故なら、フラジールは出場中の働きこそ優れているものの耐久性に問題があり、チームは結局バックアップを出場させなければならない結果アベレージが年間を通して出場する場合に比べて成績が悪くなるからである。
このことは、はじめから代替となる選手の水準(=リプレイスメント・レベル)との比較を行なうと明確である。リプレイスメント・レベルとの比較ではアベレージの評価は+18だが、フラジールの評価は+11でしかない(同じ打席数をリプレイスメント・レベルの選手が出場する場合に比べてそれだけチームの得点を多くするという意味)。
改めてリプレイスメント・レベルを定義すると、それは平均的なチームが先発出場選手を置き換える必要が生じたときに最小のコストで手に入れることができる働きに期待される水準である。
4.現実的な基準として
リプレイスメント・レベルというものが提唱される意味は、以上のウールナーのシナリオでよくわかるのではないかと思う。現実的な事情に沿って考えれば、特定の選手が存在することの価値を評価しようとするとき、平均を基準とするとその価値を見誤る場合があるということである。また、最小のコストで入手可能な手段はどのチームも持ちうるものであるから、相対的な優劣が本質である野球においてそれより低い水準は考慮する必要がない。したがって平均をゼロではなくリプレイスメント・レベルをゼロとして比較することが有効だとされる。
リプレイスメント・レベルの難点は、概念としても実際の数値としても平均に比べるとやや曖昧なことだろう。代替手段というのが実際にどのようなもので、そこに期待される働きの水準というのは定量的にどのくらいなのかがはっきりとは定まらない。このことは、評価の客観性を損なうおそれがある。また、平均という基準がリプレイスメント・レベルに比べて絶対的に劣っているということでもない。適切な評価基準は何をどのように評価したいかによるのであり、ケース・バイ・ケースであることに変わりはない。
総合すると、リプレイスメント・レベルはやや曖昧な面はありつつも考え方としては現実の事情に沿っており、たとえば数字からMVPを判断するような場合の基準として実用的であると判断することができそうである。あるモノの価値を、それを失った場合にどのような変化が生じるかによって計測する方法は普遍的なもので、リプレイスメント・レベルの議論は野球におけるそのような場合の現実感を反映している。ある選手の価値は、その選手がいなくなった場合にどれだけチームに損失が生じるかで表されるというわけである。
WAR(Wins Above Replacement)という評価指標の名前を聞いたことがあるかもしれない。現在MLBで主流の総合評価システムだが、WARはまさに選手の打撃・走塁・守備・投球といったあらゆる働きをリプレイスメント・レベルとの比較によって評価する。リプレイスメント・レベルが概念としてあるいは数値として厳密に何であるかは様々な議論があり単一の「正解」は無いが、MLBにおいてはある程度「このあたりだろう」という合意が得られており選手評価に積極的に活用されている。具体的にリプレイスメント・レベルというのはどのくらいの水準で、それを使って実際にどのように評価を行なうのかについては次回考える。
参考文献
Keith Woolner, "Introduction to VORP: Value Over Replacement Player," Stathead.com, 2001
なお、ウールナーの原典では平均を基準とする指標はTPR(ピート・パーマーによる総合評価指標)が取り上げられているが、内容上打撃以外は関係がない上にTPRが日本では馴染みがないと考え(TPRの打撃部分である)BRとした。またそのBR及びリプレイスメント・レベルに対する利得は「(2×出塁率+長打率)/3」で求められる簡易wOBAから計算した数字に置き換えた。それ以外の数字は原典と同一である。
野球の成績に限ったことではないが、評価には基準が必要である。記録や成績は単独で意味を持つのではなく、それを取り囲む文脈の中においてはじめて意味を持つ。
同じ「打率.270」でも、リーグの平均打率が.250の場合と.280の場合では意味が異なる。もっと単純に1試合レベルで考えても同様である。チームが5得点をあげても、「5得点」そのものには価値がない。問題は相手の得点との比較であり、相手が4得点以下であれば勝利となり6得点以上であれば敗北となる。比較してはじめて価値が定まる。このように相対的な比較は野球の数字において本質的である。そして、比較にどのような基準を用いるかということが重要な論点になる。
結論から端的に言ってしまえば、評価にどのような基準を用いるべきかはケース・バイ・ケースである。あらゆる場面に通用する単一の比較・評価方法というものはない。その中で、大切なのは可能な選択肢に関してその意味を把握しておくことだろう。
2.平均の問題点
セイバーメトリクスにおける伝統的な評価基準は、平均値であった。たとえば打率なら、リーグの安打数の合計を打数の合計で割ることでリーグの平均打率が計算できる。対象の打者の打率がその平均を上回っていれば優秀とするのが平均との比較の基本的な考え方である。
ピート・パーマーが開発したBatting Runsなどはまさに平均との比較をその内容としている。得点期待値に与える影響が平均的な打者程度である場合をゼロとして、平均より上ならプラス、平均より下ならマイナス評価となる打撃の指標である。
「平均」は、その基準の意味はわかりやすいのだが、一方で平均と比較するだけでは選手の価値がわかりにくいということもある。2人の打者を考えてみよう。片方は年間フル出場しBRが-2、他方は5試合の出場でBRが+1だったとする。この場合、単にBRを比べるだけでは後者のほうが高い評価となる。しかし現実的には、一軍の平均レベルの活躍を年間通して達成する打者というのはそれなりに貴重で価値のあるものである。それを、たった5試合しか出ていない選手と比べて価値が低いと評価することには違和感がある。前者の選手がもしどこかで故障していたら、チームはより能力の劣る控え選手を出場させなければならなかったから成績を落としていただろう。そう考えると、たしかに平均より低い水準であったとしても前者の選手が出場し続けたことには価値があったはずである。
これに関しては打席数も合わせてさまざまな数値を見て考量すればいいだけではないかという意見もあるだろう。しかし、このくらい出場機会が極端に異なる場合は別として、もう少し出場機会や成績の違いが微妙な場合はどちらの選手に価値があるかについて妥当な結論を出すことが難しくなる。「なんとなく」で恣意的に判断することは避けたい。
これに対してある程度明確な答えを提供するために用いられる比較基準に「リプレイスメント・レベル」というものがある。リプレイスメント・レベルはMLBにおいて選手の価値を評価する際に有力な基準とされているものである。NPBでも当然活用することができる考え方であり有用であるため、本記事ではリプレイスメント・レベルについて紹介と検討を行なってみたい。
3.ウールナーのシナリオ
リプレイスメント・レベル論で有名なのはキース・ウールナーという人物である。彼の説いているリプレイスメント・レベルの有効性に関する話がわかりやすく面白いため、それを(長いため簡略化・改変してではあるが)紹介する。
まず、ミスター・アベレージとミスター・フラジールの2人の打者を考える。両者の成績は以下の通りである。
アベレージ : 600打席 打率.260 出塁率.330 長打率.420
フラジール : 100打席 打率.300 出塁率.400 長打率.550
アベレージは安定している代わりにこれといって見応えのない打者であり、フラジールは打線に加わっているときにはMVPレベルの活躍を見せる。
さて、シーズンが終了するまでには各ポジションに600打席の出場が必要であるとする。ここでアベレージはフル出場だから問題ないが、フラジールは体力に問題があり100打席しか出場できなかった。フラジールの守備位置の残り500打席はどうなるだろうか。フラジールの耐久性の問題がシーズン開始前に明らかでなかったとすれば、チームは控えの打者を出場させるなり二軍から適当な選手を上げてくるなりすることになる。余計な代償を支払わずにチームができることはそれくらいだからである。
ここでは、チームは二軍からミスター・バックアップを引き上げてフラジールの代わりに出場させるとする。バックアップには、あまり良い成績は期待できないだろう(だからこそ彼は一軍のレギュラープレーヤーではないのである)。バックアップの成績は打率.225 出塁率.295 長打率.385とする。
このとき重要なのは、ミスター・バックアップと同じような選手は実質的にいくらでもいるということである。彼は何か特別なわけではなく、今回たまたま声がかかったにすぎない。チームは最低限のコストで彼と同じような選手をいつでも用意することができる。これは、野球選手の分布がそもそもそうなっているからである。数少ないスター・プレーヤーと、いくらかの平均的プレーヤーと、数多い控え・二軍レベルのプレーヤー。一軍平均レベルの選手は実際のところ、最小限のコストで用意できるものではない。
さて、アベレージが所属するチームとフラジール&バックアップが所属するチームに分けた場合、それぞれのチームの成績は次のようになる。
アベレージチーム
アベレージ : 600打席 打率.260 出塁率.330 長打率.420 BR 0
フラジール・バックアップチーム
フラジール : 100打席 打率.300 出塁率.400 長打率.550 BR 8
バックアップ: 500打席 打率.225 出塁率.295 長打率.385 BR -15
各人のBRを個別に見る限りでは、フラジールが最も良い選手に見える。しかしシーズン全体として考えると、フラジール&バックアップチームは平均に比べ-7と劣る結果になっている。
こうなることがわかっているとして、あなたがチームの監督なら、アベレージとフラジールのどちらを好むだろうか。出場時の成績だけを見ればフラジールが突出して優れているにも関わらず、好まれるのはアベレージだろう。何故なら、フラジールは出場中の働きこそ優れているものの耐久性に問題があり、チームは結局バックアップを出場させなければならない結果アベレージが年間を通して出場する場合に比べて成績が悪くなるからである。
このことは、はじめから代替となる選手の水準(=リプレイスメント・レベル)との比較を行なうと明確である。リプレイスメント・レベルとの比較ではアベレージの評価は+18だが、フラジールの評価は+11でしかない(同じ打席数をリプレイスメント・レベルの選手が出場する場合に比べてそれだけチームの得点を多くするという意味)。
改めてリプレイスメント・レベルを定義すると、それは平均的なチームが先発出場選手を置き換える必要が生じたときに最小のコストで手に入れることができる働きに期待される水準である。
4.現実的な基準として
リプレイスメント・レベルというものが提唱される意味は、以上のウールナーのシナリオでよくわかるのではないかと思う。現実的な事情に沿って考えれば、特定の選手が存在することの価値を評価しようとするとき、平均を基準とするとその価値を見誤る場合があるということである。また、最小のコストで入手可能な手段はどのチームも持ちうるものであるから、相対的な優劣が本質である野球においてそれより低い水準は考慮する必要がない。したがって平均をゼロではなくリプレイスメント・レベルをゼロとして比較することが有効だとされる。
リプレイスメント・レベルの難点は、概念としても実際の数値としても平均に比べるとやや曖昧なことだろう。代替手段というのが実際にどのようなもので、そこに期待される働きの水準というのは定量的にどのくらいなのかがはっきりとは定まらない。このことは、評価の客観性を損なうおそれがある。また、平均という基準がリプレイスメント・レベルに比べて絶対的に劣っているということでもない。適切な評価基準は何をどのように評価したいかによるのであり、ケース・バイ・ケースであることに変わりはない。
総合すると、リプレイスメント・レベルはやや曖昧な面はありつつも考え方としては現実の事情に沿っており、たとえば数字からMVPを判断するような場合の基準として実用的であると判断することができそうである。あるモノの価値を、それを失った場合にどのような変化が生じるかによって計測する方法は普遍的なもので、リプレイスメント・レベルの議論は野球におけるそのような場合の現実感を反映している。ある選手の価値は、その選手がいなくなった場合にどれだけチームに損失が生じるかで表されるというわけである。
WAR(Wins Above Replacement)という評価指標の名前を聞いたことがあるかもしれない。現在MLBで主流の総合評価システムだが、WARはまさに選手の打撃・走塁・守備・投球といったあらゆる働きをリプレイスメント・レベルとの比較によって評価する。リプレイスメント・レベルが概念としてあるいは数値として厳密に何であるかは様々な議論があり単一の「正解」は無いが、MLBにおいてはある程度「このあたりだろう」という合意が得られており選手評価に積極的に活用されている。具体的にリプレイスメント・レベルというのはどのくらいの水準で、それを使って実際にどのように評価を行なうのかについては次回考える。
参考文献
Keith Woolner, "Introduction to VORP: Value Over Replacement Player," Stathead.com, 2001
なお、ウールナーの原典では平均を基準とする指標はTPR(ピート・パーマーによる総合評価指標)が取り上げられているが、内容上打撃以外は関係がない上にTPRが日本では馴染みがないと考え(TPRの打撃部分である)BRとした。またそのBR及びリプレイスメント・レベルに対する利得は「(2×出塁率+長打率)/3」で求められる簡易wOBAから計算した数字に置き換えた。それ以外の数字は原典と同一である。
Baseball Lab「Archives」とは?
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。
月別著者コラム
最新コラムコメント
|
|
|
|
|
コメント