HOME > コラム一覧 > コラム

コラム

真の被本塁打率(試案)

Student [ 著者コラム一覧 ]

投稿日時:2011/06/29(水) 10:00rss

1.はじめに
 
前回の分析では,
 
・投手の被本塁打は,投手の実力だけを反映したデータではない
・球場のホームランの出やすさと投球回数によって,被本塁打数は左右される
 
ということがわかりました。投手の被本塁打と球場のホームランの出やすさと投球回数の関係を以下の図1-1に示します。
 

 
 PHRFとは球場毎のホームランの出やすさを数値化したものです。このデータに投球回数を掛け算したデータ(PHRF×投球回数)と被本塁打との関係は,相関係数が .608で,球場のホームランの出やすさとそこで登板した投球回数の値が高くなるほど,投手の被本塁打が多くなるということがわかりました。
 
 さて,この分析結果より,投手の被本塁打の中で,球場のホームランの出やすさとそこで登板した投球回数によってどの程度ホームランがもたらされたのかを計算することができます。結果を図1-2に示します。
 

 
 分析の結果,投手の被本塁打の約37%が球場のホームランの出やすさとそこで登板した投球回数によってどの程度ホームランがもたらされたことがわかります。図中の水色の領域がそれに該当します。ということは,のこりのオレンジの部分が,球場と投球回数の影響を受けていない投手の実力の部分と言えます。
 
 今回の分析は,このオレンジ色の部分を数値化して,球場の影響を受けない投手の被本塁打の指標として用いてみることを目的としています。
 
 
2.分析データ
 
 2006年から2010年までに1シーズンに40イニング以上登板した先発投手376名を分析対象としました。この投手達の所属するチームのホームゲームでの成績を分析していきます。PFのデータは,各投手が所属するホームスタジアムのデータを用いています。
 
 
3.真の被本塁打率
 
というわけで,図1-2のオレンジの部分を数値化しました。厳密な意味では,投手の被本塁打から,球場のホームランの出やすさとそこで登板した投球回数の影響を除いたものなので,投手の真の実力と運や偶然性を含んではいますが,謙虚に名付けるとややこしくなるので,便宜上強気に「真の被本塁打率」と名付けたいと思います。
 
さて,この真の被本塁打率のデータは,投手の被本塁打とPHRF×投球回数のデータから数学的に計算したものです。値が小さいほど優れているのは,普通の被本塁打と同じなのですが,分析の性質上0以下の成績の選手もいます。したがって,このデータは,「本当だったら何本打たれるはずだったデータ」,というよりは,分析対象の投手間の優劣を示すデータと見てください。
 
では,この真の被本塁打率のデータを見ていきたいと思います。全員のデータを示すことは紙面の都合上できませんので,特徴のある選手を紹介していきたいと思います。まずは,分析対象者の中で被本塁打数が0だった15名の選手の真の被本塁打率を見ていきたいと思います。データを表1に示します。
 

 
 被本塁打数が0の場合は,それ以上優れた成績はありませんので比較のしようがありませんが,真の被本塁打率を用いれば優劣をつけることができます。表を見ていただければ,PHRF×投球回数のデータが最も大きい2009年の岩田選手がこの中では一番優れているという評価になります。
 
次に,分析対象者の中での真の被本塁打率TOP15を表2にリストアップします。
 

 
 真の被本塁打率の隣に,実際の被本塁打率を示しましたが,被本塁打率の低さの順番に並んでいないことがよくわかるリストとなっています。No1は意外といっては失礼かもしれませんが,2008年の内海選手になりました。これは東京ドームのホームランの出やすさが原因であると考えられます。
 
 
4. 真の被本塁打率と実際の被本塁打
 
 真の被本塁打率と実際の被本塁打の関係をもう少し検討してみたいと思います。データを図2-1に示しました。
 

 
 図中の真の被本塁打率はデータが小さいほど,つまり,図中の左に行くほど優れていることを示します。このデータについては,少し気になるところがあります。図2-2は,図2-1と同じデータに赤い丸印を加えたものです。
 

 
 赤い丸印に注目していただきたいのですが,左側の印では,同じ真の被本塁打率の選手でも,実際の被本塁打数のデータの分布が上下に広く,一方,右側の印では,同じ真の被本塁打率の選手でも,実際の被本塁打数のデータの分布が上下に狭いことがわかります。
 
 これは,真の被本塁打率の優れた投手の中には,実際の被本塁打数が多い選手もいれば,少ない選手もいることを示しています。また,真の被本塁打の劣る選手は,実際の被本塁打数の差が少ないことも示しています。
 
つまり,真の被本塁打率の優れた投手ほど,球場の影響を受けて実際の被本塁打数が左右されやすいが,真の被本塁打率の劣る投手は球場の影響を受けにくい,といえます。
 
 
5.まとめ
 
 以上,これまでの分析結果をまとめると,
 
・投手の被本塁打は,投手の実力だけを反映したデータではない
・球場のホームランの出やすさと投球回数によって,被本塁打数は左右される
・被本塁打のリスクを左右する球場側の要因は,定量的に評価できそう
・球場側の影響を除いた投手の被本塁打率は推定することができる
・真の被本塁打率の優れた投手ほど,球場の影響を受けやすい。
・真の被本塁打率の劣る投手は,球場の影響を受けにくい
 
 ということがわかりました。
 
 さて,この真の被本塁打率は選手の評価基準としてどのような時に役に立つでしょうか?個人的には,他チームから選手を獲得する際に重要な指標となると思います。良い投手ほど球場の影響を受けるわけですから,本塁打の出にくい球場で投げることの多い投手は過大評価され,本塁打の出やすい球場で投げることの多い投手は過小評価されている可能性が考えられます。FAで投手の獲得を狙う場合,他球団で目を出せないでいる投手を引き抜きたい様な場合には額面通りの成績ではなく,球場の影響も踏まえた評価ができるようになれば,リスクを軽減し,掘り出し者が見つかる可能性も高まるはずです。
 
 しかしながら,今回の真の被本塁打率はまだまだ試作の段階です。分析の便宜上ホーム球場での成績のみを分析ですし,計算方法もまだ公式化できるレベルにありません。実用化に向けては,あと何段階かのステップがあるのが現状です。
 
 とりあえず今のところは,投手の被本塁打が投手の実力そのものを反映しているわけではないこと,球場の影響を除いた投手の実力を評価する方法が必要であることが伝わればと思います。

コメント


こんばんは。
前回は議論に真正面から向き合っていただきありがとうございました。

前回の最後にも素晴らしいご返答をいただきましたので
こちらで返信させていただければと思います。

>1つの方法としては、こうした外的要因の影響を除いた評価についての専門用語を作ってしまうことです。
>しかし、専門用語を多用するのはあまり気が進みません。

私はむしろ専門用語であっても新しい概念であることを明確にするために
新しい用語を作ることは必要だと思います。

新しい用語を作るということはそこに明確な定義をし、それを明確に示すという必要が否応なくでてくるということですから

それをすれば用語の作者が何を問題意識として持ち、
どういった視点や切り口で野球を見てデータを分析しようとしているかがわかりやすくなると共に
何より自分自身がその定義づけの中で、何をしようとしているかより明確に把握できるようになるというメリットもあります。

>結局のところ、「どこまでが投手の実力で、どこまでが投手の責任なのか」というテーマについて、
>みんなで新しい共通認識を作らなければいけない時期になってきているのではないでしょうか? 

共通認識というか、それこそここではこう見ている、という定義づけを明確に表示しておくことが必要ではないでしょうか。

もちろん、SBMラボではこういう共通認識であるという表明があればそれも歓迎ですね。

>この問題は、選手の成績=実力と考えるか、成績≠実力と考えるかの認識の違いになると思います。

この議論について、昨日Fangraphsで素晴らしい記事を見つけました。
Beating Up the Sabermetric Strawman
(http://www.fangraphs.com/blogs/index.php/beating-up-the-sabermetric-strawman/)

特に最後のパラグラフは私の言いたいことに非常に近いものです。
FIPは投手の100%コントロールできるものとして投手の担うべき責任の必要条件ではあるが決して十分条件ではない。

同じようにどれだけ純粋に“能力=実力”をつきつめていったところで
それ以外の部分に投手の“能力=実力”が100%存在しないということではなく

ただ単純にそれ以外の部分には投手の“能力=実力”を含め様々な要素が混在しているため
とりあえず分析上思い切ってばっさりと除いてしまおうという発想ですから

その純化した部分だけをとりあげて“真の実力”-つまりは能力の“すべて”-とするのは
球場の要素にも投手の“真の実力”は混在しているために
非常に危うい結論の導き方だと思うのです。

繰り返しになりますが、studentさんのなさっている試み、分析等は
ほんとうに素晴らしいもので、非常に価値のある情報発信だと思っております。

ただそれは実力の必要十分条件を満たす、同値のものを導くものではないということを主張しているまでです。

それにしても、Fangraphsでこの手の上述のポストに100近いレスポンスがあり
にぎやかに議論が交わされていることを見ると

素晴らしいな、流石だなと感嘆せずにはいられませんね。

また長々と、たいへん失礼いたしました。

Posted by ballgame_lover at 2011/06/30 00:59:42 PASS:

ballgame_lover 様

 結局、選手の成績から外的要因と運の影響を除いたものを何と呼ぶべきか?ということになりますね。

 確かに「実力」と言い切ってしまうと抵抗感があるのはわかりますが、
 かといって適当な名前が浮かんでこないので困っております。

 専門用語を作るのは方法としては良いのですが、専門外の人を置いてきぼりにせず、
 且つ誤解を招かない名前を考えるのはなかなか難しいのです。

 気の利いた名前を付けれるコピーライターのようなスキルが欲しいところ……。


 さて、ご紹介いただいたFangraphsの方にもざっと目を通してみました。

 「野球はエンターテイメントであり、ファンが興味を持っているのは、フィールド上で今起こっている結果である。
  統計を用いる分析家はそこを軽視してしまっている」

 という感じの内容でしょうか。

 これもまた、野球の1つの見方であり、楽しみ方であると思います。おそらくそういうファンの方が多いと思います。
 
 私としては、そういう考え方の人がいることは理解しつつも、選手の成績≠実力と考える立場をとる者です。
 これもまた、別の野球の見方であり楽しみ方であると思います。

 これは、客観的にどちらが正しいか、優れているかというよりも、
 どちらの考え方を個人の信条として受け入れているかという問題だと思います。
 
 お互いがお互いの立場を理解して、相手に対して寛容になれば問題は生じないと思うのですが、いかがでしょうか?  

Posted by Student at 2011/06/30 22:54:26 PASS:

Student様

>「野球はエンターテイメントであり、ファンが興味を持っているのは、フィールド上で今起こっている結果である。
>統計を用いる分析家はそこを軽視してしまっている」

申し訳ないですが、これでは筆者の意図とまったく逆です。
筆者は統計家であり、またその立場を擁護する意図でこの文を起こし、述べているのは
「私たち統計家はフィールド上で起こっていることのみに興味をもつ」
ということです。

>これは、客観的にどちらが正しいか、優れているかというよりも、
>どちらの考え方を個人の信条として受け入れているかという問題だと思います。
>お互いがお互いの立場を理解して、相手に対して寛容になれば問題は生じないと思うのですが、いかがでしょうか?  

念のために申し上げておきますが、私のブログ(http://ameblo.jp/ballgame-lover/)を見ていただいてもわかるとおり
私も統計を用いて客観的にものを分析することの重要性を常に主張し続けている者です。

その上で、相手に対して寛容になろうとするからこそ選手に敬意を表明し、
用語を作りきちんとした定義づけをしないままに
カンタンに“実力”が、それも“真の実力が”どうのこうのなんて言及するのは避けるべきと主張しております。

私も成績≠実力と考えます。というより成績をより細かく様々な要素に分けて分析していくということについては大いに賛成ですが
だからといってその一部分を“実力”と呼ぶことはおかしいと主張します。

残念ながら、私の問題提起に対してそれがそこまで重要性の高いものと賛同いただけなかったようですので
改めて、この議論はここで終了させていただければと思います。

今後とも、素晴らしい分析と情報発信を心待ちにしておりますね。

Posted by ballgame_lover at 2011/07/02 22:39:55 PASS:

ballgame_lover様

 Fangraphsの件は失礼いたしました。読み込みが足りていませんでした。

 さて、私としては正直に申し上げてこのコラムで用語論について議論するのは本意ではありません。
 このコラムの目的は、

 ・投手の成績がどの程度球場によって影響を受けているかを検証すること
 ・球場によって受けた影響を除いた投手の評価をすること

 ということなので、私としての興味は分析の精度と分析結果の実用性を高めることにあります。
 用語の名前は、皆が納得してくれるものであればそれを使いたいくらいに考えています。

 そして、今回の分析結果を「実力」ではなく何と呼ぶべきかということを突き詰めると、
 結局は「選手の成績に影響を及ぼす様々な要因を除いたものを何と呼ぶべきか?」
 というテーマに行き着くと思うのですが、それはまた別のテーマとしてきちんと議論され、皆の共通理解として決定されるべきだと思います。
 個人的には、そこで名称が決定すれば、その名前に変更することにまったく抵抗はありません。

 しかしながら、野球でそういうことを議論する場所ってどこなんだ?というのが大きな問題になると思います。
 専門の学会があるわけではないので、そういう場所作りからはじめないといけないのかもしれません。

 なので、個人的にいろいろ提案することも重要だとは思うのですが、
 「投手の成績から、球場のような外的環境と運の影響を除いたものを何と呼ぶか?」
 と言われると、私としては、やっぱり「実力」以外に良い名前が浮かばないのが現状です。

 できればballgame_lover様がどのように名付けるべきかという案をいただきたかったです。

Posted by Student at 2011/07/03 00:59:04 PASS:

>できればballgame_lover様がどのように名付けるべきかという案をいただきたかったです。

以降、おせっかいになりますがお聞きください。
用語を作り、名付けて定義を表明するということは新しい指標(=価値)を世に問おうとする者にとって
最も重要な要素であり、それは発案者の一番の重要な権利でありまた担うべきresponsibilityです。

分析の巧拙なんていわばコンピューター全盛のこの時代、誰でもできるしそこに新たな価値創造はなく
むしろどのような問題点でものを見てデータをどんな切り口で切るかこそが
studentさんのオリジナルなものとなるため

その用語を自分では思いつかないから他の人に頼ろうとする発想は
今後改められることを強くお勧めします。

私なら、FIPやDIPSにならって被BPIHRとか被BP-I-HR(BallPark Independent HomeRun)なんて名付けますが、
私がそう名付けた時点で今後この指標が広く世に価値があると認められていっても
この指標、価値の発案者は100%studentさんのものとはならない、
私にも権利があると主張される可能性を残すということですよ?
(※もちろん、私はここでその権利を明確に100%放棄することを宣言しますが)

名付け親となることはそれによってもたらされる利益に対する権利と
それに対するresponsibility(疑問、反論に対する返答をする義務)を生じさせます。

例えば、FIPを考え出したTom TangoがFIPと名付けず
“真の防御率”なんて仮の名をつけたらどうだったか、想像してみてください。

DIPSの分析で言えるのは最大でもDIPSeraまでですよね。

同じように今回の分析でも言えるのはBPIHRまでで
決して“真の被本塁打率”ではない。

・・・以上、用語について重要性を見出されていないstudentさんには計なおせっかいでしたね。
ただ、あなたが名付ければ?と言われればどうしても一言追加する必要があると思いまして、最後に返信しようと思い立った次第です。

長きにわたり、ごちゃごちゃとタイヘン失礼いたしました。

Posted by ballgame_lover at 2011/07/03 22:58:20 PASS:

ballgame_lover様

 このコラムを書いた目的について説明させてください。

 タイトルにもあるようにこの指標は現段階ではまだ思案と呼ぶ物に過ぎません。
 真の被本塁打率というのも便宜上そう呼ぶことにしています。

 まぁ完成には程遠い段階なのですが、なぜこのような状態で公開したかといいますと、
 
 投手の成績から球場の影響を除いた評価はできないだろうか?というアイデアを提案することと、
 これを読んでくださった人に、このテーマについて考えていただき、
 さらに発展させるような分析をしてもらいたいからです。

 もちろん私の方でも改善案は考えているのですが、一人で考えることには限界があり、
 多くの人がこのテーマに取り組めば、私が考えていること以上の改善も望めるでしょう。

 要するに、ここで発案したアイデアが色々な人の手を経て、最終的に良いものが出来上がればよいと考えています。
 みんなでちょっとずつ良いものを作って行くのが研究というものではないでしょうか?

 色々な人の手を経て行く過程の中で、重要な要素も二転三転するかもしれませんし、名前もその都度柔軟に変化していくべきものだと思います。
 そして、今はまだ生まれたての段階ですから、名前に固執するよりもまず中身を充実させたいと私は考えています。

Posted by Student at 2011/07/04 21:42:57 PASS:
名前:
メールアドレス:
コメント:
評価:
star2.gif star2.gif star2.gif star2.gif star2.gif
4e1aea3d2784213d11ab1db6163ffb5e.png?1493563922
画像の英字5文字を入力して下さい。:

トラックバック一覧

Baseball Lab「Archives」とは?
 
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。

野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。