Monday, February 27, 2006

Brief Description of Some Stats (2)

Runs Created (RC) 是棒球統計大師 Bill James 在 1970 年代末期發展出來計算球員貢獻的指標,時間上比那些線性的數據(最早在 1910 年代就有人開始發展類似 Linear Weights 的數據了)要來得晚。他的出發點是,得分是「上壘」和「推進」兩者的組合,因此 RC 可以用下列的公式來表示:
RC = A * B / C

其中 A 代表「上壘」;B 代表「推進」,C 代表「打擊機會」,也就是說,在相同的打擊次數中,能多上壘、多打一些長打,就能使得分增加。在第一版的 RC 中,A=H+BB,B=Total Bases,C=AB+BB。換句話說,RC 就等於「上壘率」乘以「長打率」乘以「打數」。令人驚訝的是,把一支球隊的打擊成績套入這個簡單的公式中,會發現 RC 跟這支球隊實際的得分非常接近。當代入一整個聯盟的打擊成績時,RC 跟整個聯盟的總得分誤差僅有 1% 左右,因此 James 就用這個公式來評估各個球員的打擊表現。80 年代初期 James 加入了盜壘對得分的影響,之後他又陸續發表了許多版本的 RC,把雙殺、犧牲打、三振和故意保送的效應計入,於是在 21 世紀初期的版本變成這樣:
A = H + BB + HBP - CS - GIDP
B = TB + 0.24*(BB-IBB+HBP) + 0.62*SB + 0.5*(SH+SF) - 0.3*SO
C = AB + BB + HBP + SH + SF


這個簡單的 RC 公式(第一個式子)最大的問題在於,它是從「整支球隊」的打擊成績出發的,也就是說,當我們試圖用 RC 來計算某個球員的貢獻時,它實際上是計算「當一支球隊的一到九棒都是該球員時,這支球隊可以創造多少分」。然而,我們所謂的一個球員實際在球場上創造的價值,應該是該球員跟他的隊友的打擊成績互相配合的結果。另外,也由於 RC 是從整隊的打擊成績來做回歸,過於極端的球員個人成績可能就會超出它的適用範圍。例如說,當我們試圖用 RC 來估計 Barry Bonds 的貢獻時,因為不可能有整隊的打擊成績接近他的水準,再加上「九個」Bonds 會讓超高上壘率的效應被放大許多,就會使得 RC 過度高估 Bonds 的價值。

這個問題有幾個解決的方法,其中一個我們比較常見的是 Marginal Lineup Value (MLV),它在計算一個球員的貢獻時,用了下列幾個步驟:
  1. 有八個「打擊成績等於大聯盟平均的隊友」跟該球員組成一條打線,假設該球員的打席數佔全隊的九分之一,然後用 RC 計算這條打線可以打下幾分;

  2. 用 RC 計算九個大聯盟平均球員在相同的總打席數中可以打下幾分;

  3. 該球員的實際貢獻等於 (1) - (2)。
詳細的計算方法可以參考這裡。MLV 的計算相當複雜,沒辦法直接從球員的各項打擊成績直接求得,因此很少被人引用,但它是另一個我們經常看到的數據「VORP」的基礎。

針對同樣的問題,James 在 2002 年提出了全新版本的 RC,其公式如下:
RC = [(2.4C+A) * (3C+B) / 9C] - 0.9C

這個公式的精神跟 MLV 類似,也是假設某球員跟另外八個 OBP .300, SLG .400 的球員組成一隊之後可以創造多少得分。另外,為了考慮「適時安打」的貢獻,當我們有球員打擊的 split 資料時,下列的公式可以用來調整 RC:
D = (Hits with runners in scoring position) - BA * (AB with runners in scoring potition)
E = (HR with runners on base) - (AB with runners on base) * HR / AB


把 D 和 E 的值加入原先計算的 RC,就是最後的結果。當打者的得點圈打擊率 (BARISP) 高於他的平均打擊率時,D 會是正值,表示當得點圈有跑者時,打出適時安打的額外價值。另外,若該打者在壘上有人時的全壘打比率比他自己的平均要來得高時,E 項就會為正,表示「非陽春」全壘打的額外價值。

除了 MLV, VORP 之外,另外一個從 RC 衍生出來的數據 RC/27 也經常被引用,有時被寫作 RC/G,這個數據的意義是假設當一隻球隊的一到九棒都是由某個球員所組成時,該球隊每場比賽可以得到多少分數。RC 所計算的是進攻總貢獻,RC/27 的用意則是在於計算球員的「進攻效率」。

2 Comments:

Blogger Bubble said...

堪個小錯。

E = [(HR with runners on base) - (AB with runners on base)*HR] / AB

那個中括號應該是放在最後,比較有道理。

Tue Mar 28, 12:06:00 PM  
Blogger walaykao said...

太多括號混在一起,一不小心就弄錯了,看來把一些比較不必要的括號拿掉會比較好。
多謝。

Tue Mar 28, 03:39:00 PM  

Post a Comment

<< Home