HOME > コラム一覧 > コラム

コラム

野球のデータを分析してみませんか Part.1~データって何だ?

Student [ 著者コラム一覧 ]

投稿日時:2011/06/14(火) 10:00rss

1.はじめに
 
 セイバーメトリクスと聞いたら何をイメージするでしょうか?出塁率やOPS,FIPやDER,UZRなどでしょうか?
 
 挙げればきりがありませんが,一般にセイバーメトリクスというとこれらの指標をさしていうことが多いようです。これらの指標は,野球をより実態に即した,勝つために有効な評価基準を見いだすことを目標に作られたものであります。
 
 この「より実態に即した,勝つために有効な」ということを客観的に証明するためには数学,特に統計学的な方法論の理解が必要となります。
 
 統計学の手法が理解できれば,今後も続々と開発されるであろう様々な指標を理解しやすくなります。また,自分でデータが分析できるようになれば,今まで誰も気がついていない野球の真理を最初に発見できるようになるかもしれません。
 
 とはいっても,数学・統計学と聞くと反射的に敬遠したくなる人が多いのも事実です。また,私も統計を利用はしますが,専攻しているわけではないので,どちらかというとかみ砕いて理解しているレベルです。しかし,最初から専門的で詳細な解説をして頭をパンクさせるくらいならば,かみ砕いたレベルの解説から入門してみるのも1つの方法です。
 
 というわけで,野球におけるデータ分析の方法やデータを扱っていく上での約束事について,ごくごくかみ砕いた解説をやってみようというのが今回のテーマになります。統計学入門のための入門編といったところです。
 
自動車でたとえるならば,車が動く仕組みの理解はさておき,ハンドルの切り方とアクセル・ブレーキの踏み方,方向指示器の出し方を解説して運転に出発する感じです。統計の先生が読んだら味噌汁を吹き出してしまうような内容かもしれませんが,入門の入門レベルですのでご了承ください。
 
解説をしていく上での心得を明言しておきます。
・野球のデータを用いながら解説する
・難しい数式は使わない(+,-,×,÷の使用に留める)
・高校生でもわかる内容を目指す
 
できることならば,この解説によって野球のデータの理解が進み,自分でも分析してみようという人が増えてくれたらありがたいです。未来を担うセイバーメトリシャンが読んでくれていればこれ以上嬉しいことはありません。
 
ただし,生兵法は怪我のもとです。そして,私の解説ほど生兵法なものはないと思って間違いありません。この解説を読んで自分でも分析してみようと思った方がいらしたら,改めてきちんと統計学を勉強するか,分析のできる人に相談することを勧めます。
 
 
2.データって何だ?
 
 以上が企画趣旨というか理念の話で,ここからが解説になります。車の操作方法だけ解説して,さっさと運転すると豪語しましたが,やはりある程度交通ルールの理解が必要なように,分析方法を解説する前にデータを扱う上での約束事を解説していきたいと思います。
 
 まずは「データって何だ?」という,当たり前のようでいてあまり議論されることのないテーマです。
 
 セイバーメトリクスに対するアンチテーゼとして「野球はデータで割り切れない」という主張があります。ですが,そもそも野球におけるデータとはいったい何なのでしょうか?
 
 答えは「記録と記録をまとめたもの」です。何回打席に立ったか,何本ヒットを打ったか,何球投げたか,何点取ったか取られたか等々,野球は記録で溢れています。これらの記録1つ1つがデータとなります。そして,これらの記録は多すぎるので記録をまとめる必要が出てきます。記録のまとめ方には2種類あります。1つは「数値を要約する」ことで,もう1つは「視覚的に整理する」ことです。
 
数値を要約する
 
数値を要約するとはどういうことでしょうか。それにはまず以下の表1を見てください。
 

 
この表は,巨人のラミレス選手の2010年に出場した144試合での安打数です。数値は144個あるはずです。この表をパッと見ただけでラミレス選手がどれくらいヒットを打ったかを理解できる人はなかなかいないはずです。データ(記録)が増えすぎると,それを一望しただけでは理解ができなくなることが伝わったでしょうか。この問題を解決するためには,データ(記録)を要約する,つまり「打率」を出してやれば済むわけです。打率を出せば144個あったデータを1つの値で示すことができますし,その値を見ればどの程度の成績かも理解できます。
 
冒頭に例としてあげた様々な指標も基本的にはこの「要約されたデータ(記録)」に該当します。計算方法こそ違えども,基本的には多くのデータを要約したものであるという点では共通しています。
 
視覚的に整理する
 
 視覚的に整理するというのは,文字通り図や表にして整理することです。人間は視覚に依存して生きているので,データが視覚的に整理されれば,直感的にそれを理解することができます。図1に2010年のラミレス選手と坂本選手の打率の推移を示します。
 

 
 このようにグラフ化すれば,詳しい数値はわかりませんが,年間通しての打率の変化を見て取ることができます。全く新しい分析をするときには,まずはこのように視覚的に整理することで,データの傾向を理解しておくと,後々の分析が楽になることがあります。
 
 
以上が,野球におけるデータです。要するに,球場で起こっていることが全てデータ(記録)となりうるということです。ということは,「野球はデータで割り切れない」という言葉はナンセンスになってしまいます。大体特定の選手やチームを,スコアブックに掲載されている記録だけでも除けて説明するのは至難の業です。「野球はデータで割り切れない」が信条の人でも「あの選手はどれくらいヒットや本塁打を打った」という説明はするはずですから……。
 
 
3.まとめ
 
 以上,野球におけるデータの解説でした。数値の要約と視覚的な整理はどちらが優れているというものではないので,できれば両方併記してある方が望ましいです。当たり前だけど,あまり話題にならないデータの話でした。今後は,データ分析のコラムの合間に時々挟んでいきたいと考えています。

コメント

みんなの評価:5stars-5-0.gif

素人のナックルボール視点様

我流で分析するのも楽しいですが、ある程度の統計学の知識があった方ができることの幅が広がると思います。

複雑な解析方法まで理解する必要はないと思いますが、データの性質などを理解しておくだけで大分違うと思いますので、時々解説できたらと思います。

>①データを調べることにおいて、相当な時間を要する。
>②詳細なデータは、調べようがない。

 これは仕方ないですね。私もデータ分析よりもデータ収集のほうが時間がかかります。
 自分の知りたいテーマを定めて、ある程度目的を絞ってデータを集めれば、幾分作業を軽くできると思います。

 また、個人で集められるデータも公式記録が限界かもしれませんね。
 どうしても欲しいデータが手に入らないのはもどかしいですが、手に入るデータで何とかするのも面白さのひとつだと思います。


>③発表する場がない。

 セイバーメトリクスの大家ビル・ジェームスは、自分のアイデアを最小は自費出版で世に出していたそうです。
 そこから次第に読者を獲得して、今日に至ったわけです。

 さて、このビルジェームズの時代と比べれば、今はずっと便利な世の中になっていると思います。
 Web上で自分のアイデアを公開にすることができるようになったからです。

 ここの著者の中にも、ここでの執筆とは別にHPやブログをもっている方もいますし、私もブログを持っています。
 私は、HPを作成するスキルがなかったのでブログのテンプレートをかりて、分析したデータを公開しています。
 ブログの執筆自体は、ここのコメント欄に書き込むスキルがあれば十分可能だと思いますので、ひとつはじめてみてはいかがでしょうか?

Posted by Student at 2011/06/15 21:33:53 PASS:

もしドラを読んでから、こういった一般の人にも解りやすい説明が必要だと感じていました
専門家は専門用語を使いがちですが
もっと一般的に普及していくためにはかみ砕いて解りやすく説明する事の方が大切なのかもしれませんね

Posted by you2000 at 2011/06/16 01:01:04 PASS:

you2000様

 もしドラとは「もしもドラッカーが高校野球のマネージャーだったら」といった感じの本ですよね?
 ベストセラーと比べられると質は保証できませんが、なるべく伝わりやすいよう努力したいと思います。

Posted by Student at 2011/06/16 21:40:25 PASS:

Student様

ご丁寧なアドバイス、ありがとうございました。
ブログですか、私には難しそうですけど考えてみます。
あと勝手なんですが、統計学の基礎がわかる本を紹介して
頂ければ幸いです。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/20 06:22:12 PASS:

素人のナックルボール視点様

 統計学の基礎がわかる本ですか……。
 最近は、「本当にわかりやすい統計学」みたいな本が結構あるのですが、
 ちょっと読んでみると結構難しかったりします。

 著者との相性もありますので、大きめの書店で心引かれた統計の入門書を手にとってパラパラ読んでみることをお勧めします。
 しっくり来る本があればその本を読んでみるのが良いのではないでしょうか。

 私としては、習うより慣れろ派なので、実際にデータ処理をしながら統計学の基礎を学ぶのもひとつの方法ではないかと思います。
 そういう意味では、「Excel徹底活用 統計データ分析 基礎編」といったソフトの操作方法込みの統計学の本でも良いのではないかと思います。

Posted by Student at 2011/06/20 22:29:58 PASS:

Student様
無理なご質問をいたしたようで

>大きめの書店で心引かれた統計の入門書を手にとって

昨日、探しに出向いたのですが、まあ高価ですね。
薄くてこの参考本ならば三日坊主の私でも続けられそうと思いきや、
値札を見たらビックリ。

“2500円”

1センチも満たないこの本が2500円だと、
思いもよりませんでした。
(この本に選択する予定でおります)

>習うより慣れろ派なので、

自分で申すものなんですが、結構この点に関して慣れていまして。
というのも、競馬を予想するのも趣味にいたしておりまして、
データを取りながらなにか法則性がないか、探しております。
また、蛭川様にも鍛えられていまして、
5/23日のコメント欄では未熟なりにもデータ分析をしております。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/22 19:33:13 PASS:

素人のナックルボール視点様

 >値札を見たらビックリ

 この手の本は発行部数が少ないからでしょうか、基本お高くなっていますね。
 図書館で借りてみるのも1つの方法かもしれません。

 >習うより慣れろ

 すいません説明不足でした。私もそこまで統計学に精通しているわけではないのですが、
 統計学にはいろいろな分析手法があります。

 これらの分析手法を状況に応じて使いこなすことができれば、データから法則性を導き出すことも容易になるわけですが、

 習うより慣れろというのは、新しく分析手法を学ぶ時のことなんですが、

 私としては本を読んで理屈がわかっても、いまいちピンとこないのです。
 自分でデータ分析して「そういうことか」と見に沁みて理解できるのです。

 私の想像力が足りないせいなのでしょうが、こういう人もいると思います。
 
 どちらが良いというよりも、人それぞれといった感じなので、ご自分にあった方法を見つけてみてください。 

Posted by Student at 2011/06/22 20:55:16 PASS:

Student様
度重なるアドバイス、ありがとうございます。

>発行部数が少ないからでしょうか、基本お高くなっていますね。

統計学でしょうか。(笑)

>習うより慣れろというのは、新しく分析手法を学ぶ時のことなんですが、

まあ、やってみないとはじまらないですね。
ぼつぼつと試してみます。

追伸

梅津投手のコラム、拝見しました。
その当時の体質と、変わりがないようですね。
川上哲治氏も同じような論評を示しております。

「(前略)今年のセリーグは巨人高橋、中日川上ら、
いい新人がそろった。小林幹英もその一人で、
重い直球のほかスライダー、フォークボールがよく
切れる。中継ぎだけでの3勝はダテではない。
それでもチーム試合数の半数以上の8試合は、
新人にはきつい。19日のヤクルト戦の投球を
テレビで見たが、かなり体が重そうだった。
 私は監督時代、開幕から30試合を一つの
メドとしてチームを組み立てた。いいスタートを
切るときもあるが悪い場合もある。
30試合ぐらいまでは「腹のさぐり合い」程度に考え、
無理な戦い方はしなかった。

別に○○監督(故人の方だから伏せます)が投手を
無理づかいしているというわけではない。
広島だけに限らず、今季は両リーグとも戦力が均衡化
して接戦続き。自然と中継ぎに負担がかかってくる。
長いペナントレースを考えると今の時期こそ
中継ぎも大敗用、リード用など分業制を敷くとか、
適宜休みを与えるなどの対応が必要と考える」


私がその当時つくった造語です。
“幹英、幹英、雨、幹英”
このぐらいの勢いで使われていたことを思い出します。
おそらく、梅津投手の比ではないでしょうか?
今シーズ、そのお鉢が青木高広投手に回ってきました、、、
(52試合中ー33試合に登板)

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/26 09:50:08 PASS:

素人のナックルボール視点様

 こちらでも時々解説をしていきますので、またよろしくお願いします。

 それから、私の個人的なブログの方も見てくださって本当にありがたいのですが、
 Baseball Labを見てくださっている方の中には、私のブログを見ていない方もいらっしゃるので、
 できれば感想は私のブログの方でいただけると助かります。

 せっかく感想までいただいてこんなことを言うのは申し訳ないのですが、ご協力よろしくお願いします。

Posted by Student at 2011/06/26 22:00:57 PASS:

Student様

>感想は私のブログの方でいただけると助かります。

そうですね。
失礼いたしました。

評価:stars-5-0.gif Posted by 素人のナックルボール視点 at 2011/06/28 06:16:57 PASS:
名前:
メールアドレス:
コメント:
評価:
star2.gif star2.gif star2.gif star2.gif star2.gif
d03cdc793c55d0f7818af320d90aff96.png?1503489166
画像の英字5文字を入力して下さい。:

トラックバック一覧

Baseball Lab「Archives」とは?
 
Baseball Lab「Archives」では2010~2011年にかけてラボ内で行われた「セイバーメトリクス」のコンテンツを公開しております。

野球を客観視した独自の論評、分析、および研究を特徴として、野球に関するさまざまな考察をしています。