HOME > コラム一覧 > コラム

コラム

セイバーメトリクスとは?

三宅博人 [ 著者コラム一覧 ]

投稿日時:2010/11/30(火) 10:00rss

1.セイバーメトリクスについて

  現在は便利なもので、わからない言葉があってもインターネットで検索すると簡単にその意味を知ることができます。そのように調べることを俗語でググると言いますが、英語でもインターネット検索をすると言う意味の動詞で"google"が使われます。同じようにセルホーンもセルラーホーンと言う固有名詞が携帯電話という普通名詞化したもので、他にもティッシュペーパーを意味するクリネックス等もありますが、セイバーメトリクスもそんな言葉の一つです。詳細については、それこそ"google it"してもらうとして、私が理解するセイバーメトリクスについてしばらく書くことにしましょう。
 
  まず、一般的な言葉の意味を紹介しますと、セイバーメトリクスとは・・・野球を客観的根拠または証拠により分析する手法のことです。
 例えばある選手の全体像を評価するとしましょう。当然ですが、打率だけを見ても、その選手の一部を評価しているにすぎず、そこで打点やホームラン、あるいは盗塁数等他の数字を並列して評価しようというのが従来の姿勢でした。しかし残念ながら、それぞれの数字がどの程度ゲームの結果に影響するか、あるいは将来に亘って継続できるものなのか等、それぞれの数字への評価が確立されていませんでした。従ってタイトル争いの道具となるのが関の山で、それぞれが過大評価されたりあるいはその逆だったりで、正当な評価を得ることができませんでした。もちろんそれらによって選手への”総合評価”はできず、また数字への評価が正当ではなかったと言うことは、選手へのそれもしかりということになります。
 
  セイバーメトリクスは、まずその数字への評価を確立することから始まったと言っても過言ではないでしょう。そして従来の数字では評価できない部分があることを明らかにしつつ、そこからさまざまな新しい指標が生まれました。新聞紙上でも時折見かけるOPS等もその一つです。
 

2.日本で理解されているセイバーメトリクスの誤解

 しかし日本においては、セイバーメトリックスも勘違いされてきた部分もあります。この言葉が有名になったのは2003年に出版されたマネーボールによりますが、その中で出塁率の重要さが強調されています。それがいつの間にか四球のみが強調され、四球を重要視することがすなわちセイバーメトリクスと誤解されてしまっているケースも見受けられます。
 
 四球については次の機会に詳しく触れますが、四球一つと単打一本、どちらが得点あるいは失点に大きく影響するかを単純に比較した場合、セイバーメトリクスの指標の一つであるXR(MLBバージョン)を引用しますと、四球(敬遠を除く)が0.34、シングルヒットが0.5。XRの詳細につきましては"XR 野球"でググッってもらうとしまして、簡単にこの数字の意味を翻訳しますと四球一個で0.34点、単打一本で0.5点チームの得点に貢献したと言えます。XRを引用するまでもなく、感覚的にも単打の方が得点に貢献するだろうことは、容易に想像できますし、それはどうやら正解のようですが、それがどの程度であるかを追跡するのがセイバーメトリクスの考え方の一つです。
 
 話が若干それましたが、安打が四球よりも得点への貢献度が高いことは、セイバーメトリクスでも証明されているわけで、これを見ても分かるとおり、四球のみを重要視しているわけではありません。しかし四球には安打にはない重要な要素があります。それは結果がある程度計算できるところです。
 

3.信頼度

 米国のセイバーメトリシャンの一人であるピザ・カッター氏が数年前に数字の信頼度についてリポートしました。リポートは端的に書きますと、どの程度の打席数で、例えば安打率、あるいは四球率などが信頼できる数字になり得るのかを探求したものです。一ヶ月程度の短いスパンであれば打率4割も可能ですが、同じ打者が別な一ヶ月では打率2割台に低迷するのはよく見かける光景で、両者共に信頼度のある数字とは言えません。これは計測する期間が短いために発生する数字の紛れで、その期間を長くすることにより、最終的にはその打者の実力に近い数字に落ち着くことが考えられます。それがどの程度になるのか打席数を元に測ったものピザ氏のリポートです。
 
手法は後述しますが、四球と安打については以下の結果が導き出されました。

四球率(四球÷打席数):200打席
安打率(安打÷打席数):1000打席

 正確には安打率については計測範囲内(最大750打席)では基準に達せず、上の1000打席はピザ・カッター氏の予想です。
 
 計測の手法は、打者の打席数を50打席ごとにランダムに分断し、それぞれの相関を調べたものです。相関係数が0.7を超えたものが信頼できる基準であると定め、上の例を取りますと四球は200打席で0.7に到達し、安打率は750打席をもってしても0.7に到達しなかったということです。
 
この結果はMLBのデータから導き出されましたが、NPBのデータで計算してみました。
ただ手法は異なり以下となります。

☆対称:2シーズン連続して500打席以上立った打者。
☆期間:2005年から2010年まで。
☆計算方法:2005年と2006年、2006年と2007年・・・2009年と2010年それぞれに相関係数を計算。

結果は以下の通りとなりました。
 

シーズン 対象人数 安打率 四球率
2009-2010 28 .2238 .7127
2008-2009 25 .4104 .6908
2007-2008 25 .5686 .7656
2006-2007 22 .0144 .6343
2005-2006 28 .5362 .8196
ALL 128 .3252 .7166

 サンプル数が少ないのでこれのみで判断するのは強引ですが、NPBにおいても四球率は安打率よりも信頼できそうと言う仮説は成り立つと思われます。信頼できるという意味は、例えば選手編成をする際、過去の成績が参考にできるということと同義です。つまり安打率を頼りに編成することは、四球率を頼りに編成するよりもギャンブル性が高くなるということになります。言うまでもありませんが、安打のみあるいは四球のみで選手編成をすることはありえませんので、これのみで四球が安打よりもいかなる場合も価値が高いとは言えないということは付け加えておきます。
 

4.まとめ

 四球と安打を例にとり、セイバーメトリクスの思考の一例を紹介させていただきました。恐らく感じていただけたかと思うのですが、セイバーメトリクス自体選手の評価を完ぺきにできるものではありません。しかし、それに一歩でも近づこうとするアプローチで、そういった意味では発展途上にあるとも言えますし、これは多分将来に亘ってもそうでしょう。パーフェクトな予測などあり得ませんし、それができないからこそ、野球の面白さがあるわけですから。
 
 数字をむやみに信用することは、どんな場合にも危険なものですが、どの程度信頼できるかを知るためには数字を知る必要があります。それを知らずして、”数字なんて頼りにならない”と言う論評はできません。私自身、それを完ぺきに理解しているとは言えませんが、セイバーメトリクスを知ることにより、野球の見方が劇的に変わったことは確かです。そして現在の見方が以前に比較しよりリーズナブルになったと言う実感はあります。今後この場でそれを紹介して行けたらと考えています。
 

コメント

みんなの評価:5stars-5-0.gif

 大リーグの各球団も採用しており、北米ではすでに定着した考え方で
日本でもプロ野球以外の多くの産業では当然のように採用しているもの
なのだ、ということも強調したほうがよかったかも?
まあそれは別な機会にお願いします。

評価:stars-5-0.gif Posted by りんちゅー at 2010/12/05 10:00:13 PASS:
名前:
メールアドレス:
コメント:
評価:
star2.gif star2.gif star2.gif star2.gif star2.gif
eb3e1129464409d11f17201ea0c89357.png?1513032972
画像の英字5文字を入力して下さい。:

トラックバック一覧

Baseball Lab「Archives」とは?
 
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。

野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。

月別著者コラム
最新コラムコメント