HOME > コラム一覧 > コラム

コラム

得点の重み

蛭川皓平 [ 著者コラム一覧 ]

投稿日時:2011/06/13(月) 10:00rss

1.RPWとは
 
 今回のテーマはRPW(Runs Per Win)である。Runs Per Win。日本語にすれば「一勝あたりの得点数」といったところだろうか。セイバーメトリクスでは一般に、シーズンレベルで勝利をひとつ増やすのに値する得失点差の意味で使用される用語である。
 
 野球の構造上、総得点が総失点に比べて多いほど勝利が敗北に比べて多くなるのが自然である。以前のコラム「得点と勝利の関連付け」では、その関係はおおよそ「10点で1勝」だということを書いた。統計上の傾向として、得失点差が10あるチームは、勝利が平均に比べて1多い。得失点差が20になれば、勝利の上積みは2になる。ここで得点の利得を割り算して勝利の利得に変換する数字すなわち10が、一般的なRPWである。
 
 RPWの意義は端的に言って、得点数と勝利数の関係を明らかにすることにある。それにより得点と失点からチームの妥当な勝率を導き出すことや、得点数で表される選手評価を最終的に重要な単位である勝利数に変換することが可能となる。
 

2. RPWと得点環境
 
 前述した「10点で1勝」は、プロ野球全体を概観した場合の一般論としてそうだということにすぎない。シーズンによって投高打低だったり打高投低だったりと絶対的な得点の多さは異なり、その場合得点と勝利の対応関係も変わってくる可能性がある。また同じリーグ内で考えても、守りを中心として少ない点数で争うスタイルのチームと打ち合いを好むスタイルのチームとでは相対的に得点の価値は異なるかもしれない。
 
 MLB系の解析ではこのような要素は得点環境(Run Environment)などと表現され、選手の評価に影響を与える変数となる。平均得点・平均失点が3.5・3.0の場合と5.5・5.0の場合では得失点差は同一だがその得失点差が持つ意味は異なるということである。
 
 つまり得点環境を考慮に入れると、絶対的な得点数・失点数が違えば同じ「1点」でも価値が異なると考えられるから、いつでも単純に「10点で1勝」と考えるのは正確ではない。同じ1万円でもインフレ時とデフレ時では価値が異なるのと同じ現象と言えるかもしれない。
 
 もちろんこのような点は先達にはとっくに認識されており、LWTSシステム(選手の総合的評価システム)を完成させたセイバーメトリクスの大家であるピート・パーマーは得点環境に応じて変化するRPWモデルを提唱している(というより、RPWとは狭い意味ではパーマーが作った式のことを指す)。
 
 RPW=10×SQRT(両チームのイニングあたり得点)
 
 SQRTは平方根の意味。つまり、イニングあたりの得点+失点の平方根をとり10倍したものがRPWになる。平均得点が4.5の場合で考えるとイニングあたりの得点は9で割って0.5、両チームの分を合わせるため2倍して1、最後に10倍して10。当然ながら一般的な得点環境で考えると「10点で1勝」になる。得点が多くなればRPWが大きくなる、すなわちインフレ下では勝利をもぎとるのに多くの得点が必要になることも明確に表れた式の組成となっている。
 
 このパーマーのモデルは計算も比較的容易であり実際にチームの勝率を予測した場合当てはまりもいいようであるが、私は不勉強のため式の組成の根拠を知らない。またいずれにせよMLBのデータを基にしているはずである。そこで以下では、日本で解析を行うには自前のロジックとデータによる日本用の式が必要だと考え、試論のレベルではあるが日本版RPWを考えてみる。
 

3.日本プロ野球の場合
 
 前掲のコラムでは、回帰分析を用いて得失点差を勝利に対応させた。用いたデータは2リーグ以降の全チームのデータであり、そこにはさまざまな得点環境が混在していた。RPW=約10はその結果の一般的な結論である。
 
 それに対して得点環境が異なればRPWがどう変化するのかについては、手法としてはいささか強引であると思われるが、得点環境でグループ分けをしてみればわかる。人為的な区切りではあるが今回は1950年から2010年までの全チームのデータ(747サンプル)を試合あたり平均得失点(平均得点+平均失点)で降順に並べ、20のグループに分けてみた。各グループには38(余りの関係で最後の最も得点レベルの低いグループだけ25)のデータが含まれる。それぞれのグループについて回帰分析でRPWを計算した。
 
 各グループの平均得失点の平均値とRPWは以下の通りである。
 

 


 
 基本的には得点と失点が多い環境ほど追加的な勝利を得るのに多くの得点数が必要であることを示す結果となった。自軍も相手も多くの点をとる場合にはそうでない場合に比べて「1点」がチームに与えるアドバンテージが小さいのは感覚に適う自然なことである。平均得失点からその環境におけるRPWを計算できるように一次式で近似してみると次の式が得られる。
 
 RPW=0.89×平均得失点+2.35
 
 これがとりあえずの日本版RPW式ということになる。おそらくパーマーも意味としては似たような作業をしたのではないかと想像するが、当然結果は多少異なるものとなっている。
 

4.現実データとの当てはまり
 
 今回作成したRPWがどれだけ現実のデータに当てはまるものなのか、データを使用して検証してみる。方法は、1950~2010年の期間の各年度・各チームの得点数および失点数をRPWにより予測勝率に変換、その予測値と実際の勝率の差を二乗し全てのデータについて平均した後平方根をとる。この誤差の数値は二乗平均平方根誤差といい、低いほど現実のデータと予測値の当てはまりがいいことになる。
 
 得点環境に対応することにどれだけ意味があるのか、パーマーのモデルと比較してどうかなどを明らかにするため複数の勝率予測モデルを用いて誤差を比較する。
 
 回帰:勝率=(平均得点-平均失点)/9.54+0.5
 得失点を単純に一定の数字で割って予測勝率を計算する式。全体のデータで回帰分析を行った場合に日本で最も当てはまりの良い係数9.54を採用している。得点環境の変化には対応しないことになる。

 ピタゴラス:勝率=得点^1.72/(得点^1.72+失点^1.72)
 ビル・ジェイムズ考案のピタゴラス勝率式。日本に合わせて指数は1.72に改変している。得失点比を重視するモデルであり、比が同じなら得点環境が異なっても同じ評価となる。

 パーマー:勝率=(平均得点-平均失点)/RPW+0.5
 前述したピート・パーマーのRPWを使用した予測勝率。この場合RPWは「10×SQRT(両チームのイニングあたり得点)」。

 日本版RPW:勝率=(平均得点-平均失点)/RPW+0.5
 今回作成した日本版RPWを使用した予測勝率。この場合RPWは「0.89×平均得失点+2.35」。


 
 「全体」は対象期間の全747チームのデータをもとにした結果であり、「打高投低」は最も平均得失点の高い50チーム、「投高打低」は逆に最も低い50チームを対象とした場合の数値である。極端な場合への対応がどれだけ改善するものかを見るために用意した。
 
 結果としては、誤差が最も小さいのは一応日本版RPW方式ではあるが、いずれの予測方式もほぼ差がないものとなった。あえて言えば単純な割り算モデル(回帰)は一段劣るように見えるが決定的な差ではないし、日本版RPWが良い結果を出すのはそもそも検証の対象となるデータを使用して作成した「後出しじゃんけん」なのだから当然である。むしろ日本用の調整なしでほとんど同等の結果を出すパーマー・モデルの有効性を証明した形かもしれない。

 
5.まとめ
 
 日本における得点環境とRPWの関係を調査し日本版RPWを作成した。しかし、チームの得失点から勝率を予測するという意味では過去にMLBの研究で示されているジェイムズのピタゴラス勝率やパーマーのRPWと比べて特に精度の向上は見られなかった。勝率の予測や選手の評価において、あまりこのあたりのモデル選びに神経質になる必要はなさそうである。
 
 となると今回の試み自体に何の意味があったのか、ということにもなってくるが、そのあたりは漠然と「アメリカでこのような式があるから使えばいいだろう」とするのと日本のデータで改善を試みた結果として差異が認められず可とするのとでは筋が違うということが言える。結果がどうあれとりあえず日本のデータにあたって定量的な分析が示せたのは意味があるのではないかと考えている。
 
 ところで、今季2011年は統一球の導入により得点環境がこれまでとかなり変化している。6月8日の時点で両リーグ合わせて平均得点は3.29であり、日本式RPWに当てはめると8.21となる。RPWの逆数として「1得点あたりの勝利数」を求めると0.122で、「10点で1勝」の場合の0.1と比べると1.22倍。RPWの観点から見れば、今季は例年に比べて1点の価値が1.22倍「重い」シーズンであると表現することができる。
 

コメント

みんなの評価:5stars-5-0.gif

素人のナックルボール視点さま

いえ、こちらこそ頭が硬いようで恐縮です。
どうとでも言えるような理論の扱い方に懸念があるだけで、結局は個別事象と向き合わなければなりませんし素人のナックルボール視点さまの問題提起そのものに異議があるものでは全くございません。

>佐々木投手(横浜)登場の以前と以後では、
>そのRPWも変わってきそうに思います。

仰る通りリリーバーの働きというのはここでのひとつのテーマになり得ると思います。
投手の分業制というもの自体こういう観点が本質的であると言っても過言ではないかもしれませんし
勝ち越した試合への重点的なリソースの配分というのは、傾向として勝ちに接戦が多く負けに大敗が多い結果を生むことの合理的な説明になります(この観点から興味深い事例は2007年の阪神です)。

まぁ、それで例えば過去の結果のどれだけを説明できるかはよくわからないのですが。
身も蓋もないようですが、予測勝率と実際の勝率の乖離の要因のうち最も大きな比重を占めるものは
おそらく運・偶然ではないかと思っていますので。

Posted by 蛭川皓平 at 2011/06/20 19:14:04 PASS:

蛭川様

>問題提起そのものに異議があるものでは全くございません。

いえいえ、問題提起などめっそうもありません。
感想文程度として、受け止めてください。
蛭川様のコラムを拝見していましたら、
その当時の怒りが沸々と蘇ってまいりまして、
つい感情に任せてコメントしてしまいました。

おそらく、阪神ファンだろうともJFKのJとKが、
大勝の試合に登場したならば、
ファン、マスコミに叩かれることと思います。
ましてや、セーブを取らせるために、
三イニングも投げさせた暁には、
監督不適格の烙印を押されることでしょう。

だが、○○監督は、このような使い方を強いる監督でして、
セットアップが(初期は小林幹投手、後期は横山投手です)
ほとんど無意味な使われ方をさせられました。
結局、ペナントの重要な時期の秋口には、調子を崩し戦線離脱。
挙句の果てには、メイクドラマの演出役を回る始末。
この○○監督の5年間は、忍耐を強いられました。
今でも、川上哲治氏のその批判記事を保管しております。
根深いですね私も。(笑)
その結果、広島ファンを卒業できたのですが。

このサイトには、そぐわないコメントいたしまして失礼いたしました。
さらっと、流してください。

追伸

かの「引っ張り問題」、データ収集中でして、
しばらくお待ちください。(勝手ですが)

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/22 20:28:25 PASS:

どうも広島というチームは、伝統的に、セイバーメトリクスと相反する性質を持っているようですね。
一部の投手の集中的な起用だとか、機動力重視だとか。
過去の成功体験のうち印象に強く残っている側面が成功の原因であるかのような錯覚があるんじゃないかなという気がします。

ところで件の分析についてですが、Studentさんの記事のコメント欄でもお話に出ていましたが(お持ちでないのでしたら)ブログなどを開設して発表されてはいかがでしょう。
こちらにコメントをいただけるのは大変嬉しいですしこれからも是非コメントをいただければと思いますが、せっかくオリジナリティのある分析をされているのにここで私が「なるほど」と言うだけというのももったいない気がしてしまいます。
もちろんただの提案に過ぎませんし、大きなお世話ということでしたら申し訳ないのですが。

Posted by 蛭川皓平 at 2011/06/23 22:52:21 PASS:

蛭川様
たいへん返答が遅れまして、申しわけございません。

>ブログなどを開設

現在、検討中でございます。
今までは、その当事者を念頭にアイデアや意見を考えてきたために、
不特定多数の方に伝える、ことにおいては興味が湧いてきませんでした。
「まず、伝えるべきはその当事者だろう」
そのような意識が強くブログには食指が動きませんでした。(建前でも)
私には、ほんの少しの対象チェンジが難しいと思えるのですが、
がんばってみます。
(件の分析の完成の暁には、ブログに公表する予定でおります)

>オリジナリティのある分析

あの分析は、ほんの成り行き任せでありまして、
思いのまま描いていたらあのような分析になってしまいました、
というのが実情です。
以前からあたためていた考えでもありませんし、
未だ結論にも至っておりません。
もう少々その成り行きにお付合いくだされば、たいへんありがたいのですが。

また、プロの的確な指摘は、私の思考の幅を広げるというべきか、
そこから新たな発想が芽生えてまいります。
その分析を例にとりますと

「打者の心の中は、打者が一番知っている。
ゆえに、データだけ指摘して、定量的な分析は打者自身に任せるスタンスでも
よいのではないか。
その打者に問いかける形にして
『右打ち偏重の傾向がありますが、いかがなものでしょうか』な具合です」

また

「そもそも引っ張ることに“向いた球”と“向かない球”のくる確率は、
『身体的』に50%にはならないのでは?
引っ張ることに“向いた球”がくる確率の方が、高いのではないか?
(『身体的』というのが味噌ですが、後日お伝えします)」

このような感じで蛭川様の指摘には、
たいへん思考の幅を広げさせて頂いております。
つきまして誠に勝手ですが、以後引き続きコメント頂ければありがたいのですが。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/28 07:26:35 PASS:

素人のナックルボール視点さま

成り行きで、というか頭と手を動かしてる中で問いが出てくるというのはいいですよね。
先達が「ここに問題がある」と何度も下線を引いてくれているものに関しては
問題との向き合い方が硬直的になってしまう傾向がある感じがします。

件の分析は切り口が色々ありそうですね。
私は興味深く拝見しているだけで、コメントといっても大したものはできませんので
色々な方の目に触れる機会を作るのはとても有意義なことかと思います。

Posted by 蛭川皓平 at 2011/06/29 21:53:41 PASS:

蛭川皓平様
お世話になっております。

>私は興味深く拝見しているだけで

ありがとうございます。
プロの方にそのように仰ってくれると、
たいへん自信になります。

恐れ入りますが、
件の分析で念のため抑えておきたい点があります。

「引っ張り、流し打ち」に対しての分析は、
“打率”が唯一の指標なのでしょうか。
たとえば、

○○選手は、
引っ張った場合の打率は0,300
流した場合の打率は、0,250

このように、その選手の傾向を表すには、
“打率”が唯一の方法なのでしょうか。
それとも、セイバーメトリックスでは、
別角度から数値で表す指標があるのでしょうか。
上記が唯一の方法かと伺い知れますが、
念のため質問いたします。

過去3年分の右打者の分析を
(そのデータ収集が、相当時間を要し現状悪戦苦闘しています)
別の方法で試みようとしていますので。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/07/03 19:50:19 PASS:

素人のナックルボール視点さま

>「引っ張り、流し打ち」に対しての分析は、
>“打率”が唯一の指標なのでしょうか。

いえ、これは他にいくらでもあり得ると思います。
仮にスイングに対象を絞り四死球を対象から除くとしても
たとえばwOBAのような観点からすれば
単打:二塁打:三塁打:本塁打はそれぞれ
1:1.5:2:2.4の比重で得点への影響が異なりますので
そのように重みをつけて打率を計算するのもひとつの手です。
(マイナーですが、BPS(打率+長打率)という指標がこれの良い代用になります)

このようにするとたとえば「打率は下がるけれどもその分長打が増えるため総合的な得点への影響としてはプラス」といった状況を評価することが可能となります。

問題は分析がそもそも何を明らかにすることを目的としているか、ということでして
それによってどういう指標を用いるべきかは変わってくると思います。
結論を固める際には、どの指標を用いたとしても、それが有効な範囲で言えることを言うということが重要かと。

Posted by 蛭川皓平 at 2011/07/04 20:59:24 PASS:

申し訳ございません。
私の言葉足らずで質問主旨が伝わらなかったようで。
質問を改めます。

たとえば、昨シーズンの森本選手(日本ハム時代)の
「引っ張った場合」「流した場合」の両打率は下記のとおりでありました。

引っ張った場合  流した場合
 0,297   0,301

一方、私の分析の基軸に置く、同じく森本選手の
「レフト内安打率」「ライト内安打率」は下記となります。

レフト内安打率  ライト内安打率
  約77%    約55%

(レフト内安打率=レフト安打数÷レフト総打球数、ライト内安打率も同計算式)

見比べて貰いますと、その違いは一目瞭然で、
自ずと前者と後者、各々の方向性で分析していきますと、
その結果も異なるものと予想されます。

つまり、今までの意見交換で伺い知れるのですが、
おそらく私の切り口で「引っ張り、流し打ち」の分析は
はじめての様に思えます。
だがそれとも、先達が過去にこの切り口で分析を行ない、
何らかの指標が示されているのでしょうか?

私のようなアプローチで「引っ張り、流し打ち」
を紐解いていく試みは、過去に行われていないと思われますが、
念のためその点を抑えておきたかったので、
質問させて頂きました。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/07/05 23:38:10 PASS:

素人のナックルボール視点さま

私はとくには知らないです。
ただMLBではBatted Ballデータも豊富ですしだいたいの分析は出尽くしている印象がありますので
類似するものがどこかにはあるかもしれませんね。

Posted by 蛭川皓平 at 2011/07/06 00:39:17 PASS:

蛭川皓平様

ご返答ありがとうございます。
私、発明も趣味にしていまして、
必ず過去に同じような申請がされていないか
特許庁の検索サイトで調べるのですが、
そのような機能がセイバーでもあればいいですね。
余談でした。

現在、ある「バッティングの法則」を立証するために、
しらみ潰しに“例外”が存在していないか、
データを調べております。

お手数をお掛けする事になりますので、
ご返答は結構です。

評価:stars-5-0.gif Posted by 素人 at 2011/07/07 23:56:16 PASS:
名前:
メールアドレス:
コメント:
評価:
star2.gif star2.gif star2.gif star2.gif star2.gif
83d8bd40c4832bcc326d7053891a6e46.png?1493564178
画像の英字5文字を入力して下さい。:

トラックバック一覧

Baseball Lab「Archives」とは?
 
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。

野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。

月別著者コラム
最新コラムコメント
01/18 19:52/
守備を得点換算で評価する
03/16 21:19/はる
捕手の総合力比較
11/23 09:52/
打撃指標wOBA
10/12 11:14/蛭川皓平
主観の落とし穴
10/09 22:37/素人のナックルボール視点
主観の落とし穴