2017年11月21日 星期二

錯的代價

和大部份賭仔一樣,池某也是樂於贏錢,討厭輸錢的。不過在一種特別的情況下,池某並不介意輸點錢,且不希望在這種情況下贏錢。那就是在自己決策犯錯或失誤的時候。

要做成一件事是需要成本的,犯錯是難以避免的成本之一。如果錯誤的決策一開始就導致輸錢,那是值得慶幸的事,因為這是以最小的代價去發現及修正一個錯誤。相反,如果決策錯誤卻一開始就因為運氣而贏錢,問題就嚴重了,這會導致往後的時間都極難發現這個錯誤的存在,甚至積非成是,指是為非,混淆自己的判斷,以為錯的是對,對的是錯,最終要為這個錯誤付出極大的代價。


面對自己的錯誤,最容易的選擇當然是像大師們那樣視而不見、視若無睹,給自己一個無限補時,就能“證明"自己“永不犯錯"了。但賭馬沒有補時,連輸三幾個賽日,就不得不誠實面對,無從逃避。

上文談到暑假期間為model多加了20多個factor迎接新馬季,結果弄巧反拙,新馬季開鑼後接連輸錢。這確是有點意外,因為從所有的統計指標來看,這些factor都沒有任何問題。

惟有翻資料找原因,後來終於找到,原來單看統計指標是不夠的,p-value小於0.05的parameter,並非一定有實際意義。所選取的factor,只要能反映出取值範圍的變化趨勢,統計指標就會顯示其具有統計意義,而不會理會取值範圍的符合程度。也就是說,這樣的factor可能是對實際毫無影響的,其存在甚至可能還會毒害與其相關性高而有正面影響的factor。不過,始終找不到判別這類factor的簡單方法,只能慢慢摸索了。

比較確定的是,這樣的“有毒"factor,較容易出現在相關性高的factor之中,故此,第一步需要做的,是“減肥排毒",大幅砍掉重複使用的參數,一下子就刪了20幾個factor,變到model的factor數量比“抖暑"前還少,結果是──時輸時贏,輸多贏少。

2017年11月7日 星期二

軟肋

暑假前有blog友留言直指池某“唔識馬",所說的是事實,一直以來池某忙於計數、砌model,反而忽略了這個遊戲的主體對象。在此要特別多謝blog友坦誠指出池某的弱點與不足。“抖暑"期間,池某找到了一位以傳統方式賭馬的高手,補強一下這個軟肋。

高手以賭WP為主,沒有使用統計模型,也沒有使用Kelly Criterion,每場只押注一匹馬,近年每個馬季都保持七位數字純利,且每季續有進步。

傳統方法與統計模型能否兼容呢?細談之下,才發現大家的計算方法和投注策略並沒有大分別。高手雖然沒有使用統計模型,但他的做法同樣是羅列了一大堆factors,然後根據累積的賽果不斷微調這些factors的比重,只是沒有經過做regression這個過程而已;另外,高手雖然沒有直接使用Kelly Criterion,投注策略的背後意念與Kelly Criterion還是非常接近,其具體做法是,先定下一個相對於本金結餘的投注比例區間,然後根據所選馬匹的機會率與賠率,在區間的上下限之內選取一個比例下注。

如果要比較大家的不同,池某覺得很像中醫與西醫的分別。高手像個老中醫,可以憑經驗根據有限的factor快速準確斷症,執藥的劑量也較靈活隨意且具針對性;池某的做法則像西醫,任何情況都要把整套程序由頭到尾走一遍,遇到特別的情形也不能變通,好處則是即使碰到複雜混亂的局面都不會增加自己的精神負擔,長期作戰亦沒什麼壓力。

統計模型明顯不及傳統方法之處,是對初出馬的估算,缺乏足夠數據之下,model對初出馬的計算完全是無能為力,傳統方法則或多或少算是有法可依。高手對此尤其擅長,他非常關注馬匹特別是質新馬的賽前部署,由馬匹抵港隔離檢疫露面出操就開始追蹤,例如今季的一出即勝的“同得福"、“電子大師"等等,都逃不過他的法眼。

但如何將傳統的決策邏輯變成可做regression的數據是一個問題,比如晨操,傳統的做法可以根據功夫是否完整、有否缺課,甚至跑姿、毛色等主觀觀感,綜合出“好或唔好"這樣的判斷結果,這些都不容易以完全客觀的數字來表達,而且馬匹的晨操還包括了試閘、快操、踱步、游泳等項目,簡直是混亂凌亂,無從下手,故晨操一直是池某的model所欠缺的一塊。

在高手的引導下總算為model補足了晨操這一塊,且在這種縱向思維的刺激下思緒如泉湧,一下子為model新增了近20個factors,以前所未有的鼎盛陣容迎接新馬季開鑼,結果是──輸錢!

下回再談。