星期五, 8月 31, 2007

搞笑的Gameday

自從Joe P. Sheehan利用Enhanced Gameday來解析投手,這玩意兒已火紅了有好一陣子。不過我天生反骨,始終對使用數據來評斷球路的變化幅度持著保留的態度。趁最近有空,想了解Enhanced Gameday有啥缺陷,順便貶一下被吹捧成大帝的Hughes~

為了趕時髦,我也搞了張依球速分類的pFX_X和pFX_Z的分析圖
從圖來看,Hughes的fastball、curve、changeup的pFX_X與pFX_Z形成三個對稱群,slider的pFX_X與pFX_Z則歸納於同一個群組。每顆球都經過我眼睛鑑定~

Fastball
直球因球速的關係,要區分錯誤都很難,在加上直球往右打者內角會竄(pFX_X為負值)。理論上2-seamer的pFX_X會較大,4-seamer的vertical movement(pFX_Z+)會比理論軌跡還要高。




Slider
認知上,pFX_X+越大,horizontal break就越往右變化(捕手視點)
不過實際上,pFX_X+值並無法與變化幅度成正比,在我眼睛認證的過程中,注意到有幾顆球明明是hanging slider,pFX_X值卻比較高。

只看Gameday上的逐球數據#90(pFX_X3.027、pFX_Z0.344),#91(pFX_X6.149、pFX_Z-0.145),#91的橫向位移值明顯較大,但卻是顆變化幅度很小、沒掉下來的滑球。我另外注意到Vx0的差別,所以嘗試找出pFX_X與Vx0的關係。



圖2: 具體指出pFX_X與Vx0的inverse relationship
Vx0是放球點出手速度在左右橫移的分量,pFX_X值會受到Vx0的影響而減少或增加,換句話說,實際進壘點的橫向位移會因Vx0+的增加而接近理論軌跡。
假設有兩顆實際變化幅度相當得滑球,其中一顆Vx0遠大於另外一顆,Vx0較大的那顆滑球,pFX_X會明顯較小。

這場球slider投得不多,通常BA說已封劍、再不與世人一爭長短的球路,基本上都上不了檯面,Hughes當然也不意外~

Hughes這場的樣本數實在太少,為了強調pFX_X根本就是搞笑的玩意,我特別看了場Peavy的投球,對照pFX_X與滑球實際變化程度是否當符合。
發現這場球Peavy投了幾顆65分的slider,Gameday上的pFX_X值很低(0.31),Vx0卻很高(7.053)



就Peavy這場球為例,不難發現pFX_X與Vx0呈反比關係。很顯然光看pFX_X是不可靠的;具體的說,如果不考慮Vx0的影響來判斷movement的話,分析半天所得的結論會很搞笑~
在Gameday上,有時提前落地、overthrown的slider,pFX_Z卻高得有點誇張。我想相同的解釋,大概也能運用在pFX_Z與Vz0上。

寫到這我已沒有動力再繼續鑽研Gameday上的數據,誤差性實在太大,搞了老半天還遠不如用眼睛看。

星期二, 8月 21, 2007

A Rough Draft of my Thoughts on Artificial Turf

前幾天在我最近才發現的blog,看到了一篇有關滾地球投手在artificial turf表現變差的解讀。
我不否認有不少滾地球投手在人工草皮有顯著的落差,不過作者只採用了在Skydome/Rogers Centre的樣本,似乎狹義了點...
基本上artificial turf的球場大多是偏打者、中性屬性,早期有Kingdome、Olympic Stadium到沿用至今的Rogers Centre、Tropicana Field、Metrodome等。我隨便翻了些投手在turf上的表現,因樣本數的考量,也照樣地把Brandon Webb、Felix Hernandez、Fausto Carmona、Aaron cook等人排除在外。

NameSplitIPERAH/9
Kevin BrownGrass27283.218.40
Turf424.13.739.21
Tim HudsonGrass1693.23.528.51
Turf1302.988.45
Scott EricksonGrass15474.699.92
Turf813.24.399.74
Kenny RogersGrass2692.24.249.34
Turf4063.959.29
Derek LoweGrass 1506.13.478.75
Turf182.26.2610.15
Andy PettitteGrass 2199.23.819.39
Turf278.23.889.14
Jake WestbrookGrass859.14.449.57
Turf124.24.0410.32
Wang Chien MingGrass4233.709.17
Turf62.25.0310.91


我本來打算BABIP包括在Table裡,不過我沒找到現成數據,又懶得算,就因此而作罷。
在這8人裡Scott Erickson在Minnesota投了6季,Metrodome的成績在所有球場中算滿出色的,ERA只有4.15,低於在 artificial turf上的平均值。Metrodome以外的人工草皮球場,ERA高達4.97。於其說Scott Erickson在artificial turf上表現較出色,不如說在主場較猛。
Kenny Rogers在Minnesota也丟了一季,特別的是,那年Metrodome的數據遠差於生涯在artificial turf上的平均值。

其他投手,除了Derek Lowe、王建民外,在人工草皮上並沒有明顯地落差,Jake Westbrook、Tim Hudson還比在天然草皮上猛!

值得一提的是,在人工草皮上被打爆的那兩位,除了sinker外,secondary pitches好像都沒啥看頭,難道這是...

至於Halladay,我想他不只在Rogers Centre囂張,在其他人工草皮上他一樣能逞兇鬥狠~

SplitIPERAH/9BABIPBA/OBP/SLG
Rogers Centre782.23.378.39.280.245/.289/.378
On other Artif. Turf140.13.018.02.277.241/.288/.344

星期日, 8月 19, 2007

Batted Ball Tendency

近對batted ball tendency有點疑惑,照理講LD是較容易出現安打的打擊結果,不過我老覺得GB也很容易出現安打。整體來說,groundball pitchers的BABIP也沒比較低。為了探討何種型態的打者最容易擊出安打,整理了些LD%、GB%、FB%的data來玩玩~

首先,我採用了178位MLB打者在8月15日前的資料,做了些simple linear regression analyses,看能否找出independent variables ( LD%、GB%、FB%)與dependent variable的關係。


從Fig.1來看,BABIP與LD%是positive correlated,換句話說,as the amount of independent variable,LD%,increases; the dependent variable,BABIP, also increases.



Fig2:GB%跟BABIP是有positive slope, 不過沒LD%那樣明顯。




Statistically,球打高的次數越頻繁,BABIP就越低,趨勢還滿顯而易見的,比想像的還大。

從數字的角度來分析,LD、GB、FB轉換成安打的機率也許比光看圖表來得精準。

PEARSON Product (r)LD%GP%FB%
BABIP.512.191-.373


從這table來看,GP與BABIP並沒有特別引人注意的關係,換句換說,GP%的變動,並不會對BABIP有啥影響。LD%、FB%的correlation coefficient也沒強烈到能當作predictor來看待。

從以下的表格就可略之一二:

R^2LD%GP%FB%
BABIP.262.036
.139

"R2 is a statistic that will give some information about the goodness of fit of a model. In regression, the R2 coefficient of determination is a statistical measure of how well the regression line approximates the real data points. An R2 of 1.0 indicates that the regression line perfectly fits the data."
上述的分析都是以整體、平均的觀點來分析。接下來將以個別球員來看batted ball tendency與BABIP的因果關係...

Top 10 GB% of BABIP:
NameGB%BABIP
Luis Castillo67.1%.333
Derek Jeter57.3%.369
Tony Pena57.2%.318
Ichiro Suzuki55.8%.376
Joe Mauer54.3%.342
Casey Kotchman53.9%.315
Shawn Green53.2%.300
Orlando Hudson52.6%.333
Mark Teahen51.8%.366
Juan Pierre51.8%.302


從這table多少能看出Top10 Groundball hitters的BABIP都滿高的,棒球場上就是有些奇人異士,GB%越高,BABIP就越唬爛。
Ichiro Suzuki就是很好的例子。2004、2007年的GP%皆比其他球季來的高,在這兩球季,LD%很恰好地也同時低於20%。但有人能主張Ichiro都是靠唬爛、運氣來維持高檔的BABIP?

我的結論是以那些強者的能力跟天賦,不管用啥方式,BABIP會趨向符合自身實力的合理值。換句換說,大樣本所得到計算結果,有時很難對單一球員一概而論。

最後補上一些LD%的個人數據,不然發現結論有時會因個人假設而不同。打個比方,我假設LD%與BABIP有強烈的因果關係,挑有利於我的數據來闡述,這時得到的結果就會失真。事實上,LD%的R、R2多少說明LD%並不是很理想的BABIP estimator。

Top 10 LD% of BABIP:
NameLD%BABIP
Chone Figgins25.6%.400
Michael Young25.4%.358
Brendan Harris24.5%.347
Placido Polanco24.3%.351
Paul Lo Duca23.9%.277
Jorge Posada23.6%.398
Todd Helton23.5%.331
Edgar Renteria 23.3%.378
Delmon Young22.8%.348
Shannon Stewart22.6%.324


Bottom 10 LD% of BABIP:
NameLD%BABIP
Ray Durham12.8%.250
Chris Young13.6%.249
Gary Matthews Jr.13.6%.310
Nick Punto14.0%.245
Adrian Beltre14.0%.286
Brian Schneider14.1%.251
Aubrey Huff14.2%.301
Richie Sexson14.3%.219
Casey Kotchman14.5%.315
Dan Uggla14.7%.290

星期三, 8月 08, 2007

田中将大

我先承認我對田中将大被譽為松坂二世很不以為然,也許多少有受到stfo那篇06夏季甲子園之熱血物語--田中將大篇的洗腦^^
看了田中的投球後,我不否認田中将大有在日職呼風喚雨的能力,但是個媲美松坂大輔的怪物,我想還是炒作的成份居多。

田中的stuff與某位昔日甲子園怪物還挺類似的,在此先賣個關子,待會再來談他。

2007.7.28 vs. Orix Buffaloes

田中這場球fastball有投出來,fastball sits at 142~148km/h,最快150km/h,最慢138km/h,均速145.4km/h。 我平常有注意Yahoo!プロ野球文字轉播的習慣,有好幾場fastball都催不出來,大約在137~143km/h。以高卒新人來看,田中算有把fastball飆出來,據說當紅炸子雞Darish在新人年連一顆150km/h的fastball都沒有。不管如何,對田中來講,假設直球能穩定地投在90mph,在NPB吃香喝辣應該沒啥問題。

就這場而言,slider倒是滿詭異的。一般來講,slider的速度越快,多少會犧牲些變化幅度和銳利度。田中卻反其道而行,球速135+km/h的slider比80mph上下的來得銳利,變化幅度及軌跡還帶有點下切的味道。整體來說,135+km/h的slider大概有plus的評價;投在low-80s則只有50~55分不等的水準。

另一點讓我感到驚訝的是,田中的forkball,131~138km/h,已能穩定地保持在55分的高水準。假以時日,進化到plus的火侯,也沒啥好意外的。至於curve、changeup,皆是投心酸的球路,就不多贅述了。


公佈答案,那名昔日甲子園怪物就是寺原隼人。 今年的他有如脫胎換骨一般,我之前就提過,寺原的投球已列入我的觀看重點。

2007.7.25 vs. Yomiuri Giants
帳面上,這場被萬惡的巨人軍轟爆,stuff倒還不差。
fastball大約在141~148km/h之間跑,,最快151km/h,最慢138km/h,均速144.74km/h。這場丟了幾顆cutters:142km/h(2顆)、137km/h(1顆)、1顆沒測速顯示。

slider丟在128~135km/h,50~55分,與田中較慢的slider差不多。Forkball的軌跡滿漂亮的,但下掉的轉折點似乎硬了點,131~136km/h,平均來看有50~55分。
寺原也會投curve,變化軌跡明顯比田中來得有威力,不過也沒好到哪去就是了。