星期日, 2月 17, 2008

Winning Formula

相信不少人曾用過Pythagorean formula來估計勝場數,後來BP那群人又搞了些exponent的公式出來,不過這些玩意都是在比得失分來估算謂應該有的勝率。去年以得失分差為假設基礎所算來的結果可說是大槓龜...如Diamondbacks,Mariners等隊。我曾看過不少數據頭對Pythagorean formula很感冒,認為這是個無中生有的公式,沒有意義。這群人大多搞了些像WPct = 0.5 + m*a, a=(RS-RA)或是(RS-RA)/(RS+RA)的linear equation來說嘴。不過又有幾人可以解釋為啥光看linear form就夠準,其中又有何意義?

simple linear regression導出的模型
W% = 0.5 + m*a

a=(RS-RA)/(RS+RA)

Pythagorean formula也能改成帶有a的模樣:

W% = (1+a)^x / ((1+a)^x + (1-a)^x)

我必須再次強調這些模型所算出來得勝率是建構在得失分差上;換句話說,在得失分差為零時,勝率永遠是50%。

從數字來解釋也許會較簡單易懂,當RS=RA、a=o時,f(0)=0.5,勝率為50%

RS=1 RA=0時,f(1)=1,勝率則是100%

相反地,RA=1 RS=0,f(-1)=0,勝率為零

相信明眼人已看得出來,這時可以運用Taylor series把f(x)展開:



f(x) about a point x=a,a=o:



f'(a)>0 ,-1 < a < 1

還可以把它簡化成:



真實世界裡,cubic以上的terms會是很小的數字,只看linear部分就行了:



拿像WPct = 0.5 + m*a 這種以simple linear regression去fit出來的模型,就對Pythagorean formula嗤之以鼻、表示不屑的人, 不知在屌啥?

沒有留言:

張貼留言