積微錄: 軟肋

2017年11月7日星期二

軟肋

暑假前有blog友留言直指池某“唔識馬＂，所說的是事實，一直以來池某忙於計數、砌model，反而忽略了這個遊戲的主體對象。在此要特別多謝blog友坦誠指出池某的弱點與不足。“抖暑＂期間，池某找到了一位以傳統方式賭馬的高手，補強一下這個軟肋。

高手以賭WP為主，沒有使用統計模型，也沒有使用Kelly Criterion，每場只押注一匹馬，近年每個馬季都保持七位數字純利，且每季續有進步。

傳統方法與統計模型能否兼容呢？細談之下，才發現大家的計算方法和投注策略並沒有大分別。高手雖然沒有使用統計模型，但他的做法同樣是羅列了一大堆factors，然後根據累積的賽果不斷微調這些factors的比重，只是沒有經過做regression這個過程而已；另外，高手雖然沒有直接使用Kelly Criterion，投注策略的背後意念與Kelly Criterion還是非常接近，其具體做法是，先定下一個相對於本金結餘的投注比例區間，然後根據所選馬匹的機會率與賠率，在區間的上下限之內選取一個比例下注。

如果要比較大家的不同，池某覺得很像中醫與西醫的分別。高手像個老中醫，可以憑經驗根據有限的factor快速準確斷症，執藥的劑量也較靈活隨意且具針對性；池某的做法則像西醫，任何情況都要把整套程序由頭到尾走一遍，遇到特別的情形也不能變通，好處則是即使碰到複雜混亂的局面都不會增加自己的精神負擔，長期作戰亦沒什麼壓力。

統計模型明顯不及傳統方法之處，是對初出馬的估算，缺乏足夠數據之下，model對初出馬的計算完全是無能為力，傳統方法則或多或少算是有法可依。高手對此尤其擅長，他非常關注馬匹特別是質新馬的賽前部署，由馬匹抵港隔離檢疫露面出操就開始追蹤，例如今季的一出即勝的“同得福＂、“電子大師＂等等，都逃不過他的法眼。

但如何將傳統的決策邏輯變成可做regression的數據是一個問題，比如晨操，傳統的做法可以根據功夫是否完整、有否缺課，甚至跑姿、毛色等主觀觀感，綜合出“好或唔好＂這樣的判斷結果，這些都不容易以完全客觀的數字來表達，而且馬匹的晨操還包括了試閘、快操、踱步、游泳等項目，簡直是混亂凌亂，無從下手，故晨操一直是池某的model所欠缺的一塊。

在高手的引導下總算為model補足了晨操這一塊，且在這種縱向思維的刺激下思緒如泉湧，一下子為model新增了近20個factors，以前所未有的鼎盛陣容迎接新馬季開鑼，結果是──輸錢！

下回再談。

183 則留言:

Unknown2017年11月7日晚上11:03
池兄，好高興見到你的新文。如果將馬晨操同狀態量化，的而且確是個難題。希望你繼續努力，有新的成果同我地分享。
回覆刪除
回覆
joseph leung2017年11月7日晚上11:28
原來馬是可以游水的, 長知識了. :)

呢篇文幾有意思, 也間接反映了現在傳媒經常力推的'機械可以完全取代人類'的膠論'是不可能實現的. 其實現在大多的machine learning的方法是取決於大數據. 技術上的algorithms/statistics等, 早已在數十年前出現.近5年大大改善, 只是因為電腦擁有的海量數據比從前大數萬倍. 技術上已沒有什麼新意了. 但我們不能忘記, 世界上很多事情是需要人們在不夠數據下的情況做決定的.

很簡單一個例子, 現在很多新軟件中文輸入法, 是希望做到tailor-made, 即是從一個人平時在手機打字, 或用的app,或點擊的網頁/搜索等等, 得到足夠數據去預測一個人將會打或用什麼字, 用以增加輸入法的速度. 但要拿到足夠數據, 相信憑一個普通人打一世字的數量也不足夠.
回覆刪除
回覆
joseph leung2017年11月7日晚上11:33
以股市做例子, 周不時出現的供股, 分拆, 私有化等, 的確會做成市場錯價而產生投資機會, 而公司生意,管理層決定等,全是互動因素, 這一些因素不可能因為過去股市的海量數據便可成功預測, 我個人不認為機械可以找到這一些套利機會.
回覆刪除
回覆
學生哥2017年11月8日中午12:53
池兄：

即是你的model現在就有50多個factors? 純粹問一下，你是如何解決難題的? 重用舊model定係再加factor以stabilise新model?
回覆刪除
回覆
賭人2017年11月8日中午12:57
賭人認為無論用regression model定deep learning對賽馬做stat/prediction 都唔能夠全完避免randomness 的影響
回覆刪除
回覆
StEvEn2017年11月8日晚上10:15
池某, 我想請教關於半自動投注的問題。怎樣從EXCEL把計算金額去到馬會投注?可以SHARE一下嗎?
今天R2 R6都中!!但因為沒有半自動投注的關系都錯過了幾過億.

求指點迷津
回覆刪除
回覆
學生哥2017年11月9日下午6:54
池兄：

最近開始進行了自己少少研究，在這個blog獲益良多。想問一下，你用的應該是conditional logit model? conditional logit model同multinomial logit model有乜分別? 以我的理解，multinomial logit model是用於多個possible outcome，但是賽馬一係贏一係輸，為何很多作者說這是MLR?

感謝回覆。
回覆刪除
回覆
老賭徙2017年11月9日晚上8:30
完全同意賭馬必須識馬，跑馬就是跑馬唔係跑人。雖然的確有「做馬」情況，但主使做馬「楊先生」自已都輸錢，這証明「做馬」只不過是一個冇效factor。池兄，模型加「識馬」這肯定是最佳出路，恭喜！
回覆刪除
回覆
匿名2017年11月10日上午10:32
池兄﹐請教組合獨贏對初學者來講會唔會較容易小試呢?
回覆刪除
回覆
學生哥2017年11月10日晚上10:23
其實有冇3揀1既投注金額資料？馬會網站只有獨贏包括3揀1既金額，比較有興趣知道有幾多人到底會投注3揀1...
回覆刪除
回覆
匿名2017年11月11日上午9:07
概念係: 如果找到因素分析出某幾場熱門組合過熱/頭馬機會低﹐再加投注分配得宜﹐長遠計能否正回報?
回覆刪除
回覆
陌生人2017年11月11日上午9:44
二個系合併彩池，你買組合獨赢和買獨贏賠率是一樣的
回覆刪除
回覆
michael2017年11月11日下午4:44
嘩，金太陽58倍。
回覆刪除
回覆
匿名2017年11月11日下午6:22
想請教池兄
本人是用kelly的, 遇到的問題是本來那匹馬kelly建議可以買的, 但隨著ro不斷熱而慢慢變得不值買, 特別是有時遇到綠啡格, 最後搞到kelly叫不要買了.
理論上落飛黨應該是覺得有機會才會大量落飛, 但卻影響到變了過熱, 這問題是我的eo計算不夠準才會這樣嗎?
回覆刪除
回覆
StEvEn2017年11月11日晚上11:43
請問池兄, 明天海外賽事S2 可找到初盤的參考賠率嗎?
馬會只提供S1 參考賠率，並沒有提供S2的....
回覆刪除
回覆
Leba2017年11月12日下午4:30
「中醫」和「科學化後的中醫」，後者雖任重道遠，卻更勝一籌。
憑感覺看晨操可能頗有用，數據化後的晨操應該會更有用。
我也有想過把類似的資訊數據化，但除了操練頻率之外就不知道何處入手。
似乎與晨操相比，試閘數據會比較容易使用？
回覆刪除
回覆
匿名2017年11月14日下午5:17
想問版主是用SPSS還是SAS? 方便分享一下有哪一些factors嗎?
回覆刪除
回覆
匿名2017年11月14日下午6:43
請問，
我用excel 2007 嘗試用 vba錄製並下載馬會"馬匹資料” ，為什麼不成功，請指點！
回覆刪除
回覆
宸獋憴2017年11月14日晚上8:58
做到的
回覆刪除
回覆
匿名2017年11月14日晚上9:55
那麼，請問你是怎樣下載馬會的"馬匹資料"？
回覆刪除
回覆
學生哥2017年11月15日凌晨12:23
池兄：

伸手黨多只是因為您有料，大家想跟你搵錢，別太上心！辛苦了。
另外奉勸一下大家，問問題之前睇下其他post的comment，無謂一個問題問幾十次。
回覆刪除
回覆
匿名2017年11月15日凌晨2:01
呢位"學生哥”得罪了很多人亦侮辱了很多人。
別人來看的是Blog，亦不用你插嘴，始終係一名學生哥不懂世道！
如果Blog主認為有伸手黨，可以書面拒絕一切回答。學生哥實在太多嘴。
回覆刪除
回覆
匿名2017年11月15日上午8:28
非常同意池兄的見解，砌Model 最大的樂趣係享受當中的過程同埋解決問題後的成功感。其實砌Model 過程中你會學到Excel 函數、VBA、統計軟件(如SAS) 等知識，呢D知識對工作上幫忙好大(如果閣下係文職)。所以即使個Model 最終幫唔到我羸錢，我都覺得係賺左！

Dicky上
回覆刪除
回覆
匿名2017年11月15日上午9:00
條友仔又唔爬文，仲下下伸手黨求分享，無_嘢呀話？老馮架？就算俾埋你都唔識用啦！你睇老賭徒，咁大年紀都自己一手一腳搞掂，你條友醜唔醜呀？

路過都睇唔過眼
回覆刪除
回覆
匿名2017年11月15日中午12:25
問一句就畀人鬧到懵！！！
還記得無線有套劇集叫”絕代雙驕”，惡人谷內有一個叫做”小魚兒"的人。難道”池裡漁”就是”小魚兒"？？？
只可說
神亦是你鬼亦是你！
回覆刪除
回覆
匿名2017年11月15日晚上9:14
支持池兄 x 2

Dicky
回覆刪除
回覆
匿名2017年11月16日中午12:52
請問一下池兄
閣下的模型通常贏的是本來機會率很高的還是經過kelly處理後一些機會率本來沒很高的?
回覆刪除
回覆
匿名2017年11月17日晚上10:57
池老師你好，我計孖寶半全場無論頭場或尾場，上半場經常都係0:0, 1:0 或者 0:1，你有冇遇到呢個問題？
有冇話特登避開某些波膽？
回覆刪除
回覆
StEvEn2017年11月18日下午3:15
請問池兄賭馬Kelly 個amount 係用fixed 好似10000咁，還是根據每場輸贏增加或減小amount?
回覆刪除
回覆
學生哥2017年11月18日晚上10:01
池師兄、老賭徒師兄：

最近在你們的blog上面看到用iMacros來投注，我大致明白如何運作。然而想請教一下兩位老師，你們是如何解決馬會網站要求輸入安全問題答案的呢？我試運作過iMacros，好似冇辦法輸入正確的安全答案。
回覆刪除
回覆
匿名2017年11月18日晚上11:01
請問池兄一般來說, 模型裡騎練這2個參數, 參數值互相比例大概是多少才算比較合理而沒有讓任何一方過強呢?
回覆刪除
回覆
Unknown2017年11月19日下午1:34
如果用無處理過的騎練勝率放人Model，一般都係騎強過練，但比例不會相差太遠。

Dicky
回覆刪除
回覆
匿名2017年11月19日下午6:48
謝各位意見
無處理時的確是騎強過練, 而且我的是強很多(5, 6倍), 不知是不是我的問題
所我想減少盲目追捧強騎師的影響, 所以做了弱騎強練的處理, 現在練強點大約1:2.5左右, 算合理嗎?
回覆刪除
回覆
Unknown2017年11月19日晚上8:40
要視乎你有幾多factor 同有咩factor ，好難一蓋而論。不過只要你個Model 的factor 夠多自然可以攤薄騎司效應，無需刻意去做。
回覆刪除
回覆
Unknown2017年11月19日晚上10:39
池兄係你個Blog 班門弄斧真係失禮晒！哈哈
今日戰果如何？
回覆刪除
回覆
匿名2017年11月19日晚上11:57
池大師, 有一個問題我還是不太清楚如何面對。
問題其實非常直接: 在做那個model的時候, 是直接用binary logit regression, 將每一隻馬的factors拆開成為不同的independent variable, 如果輸了就當dependent variable=0反之當1? 還是要用到conditional logistic model, 把一場馬裡面的馬分成不同的strata, 例如一場的所有馬group在一起, 同樣的輸了就當dependent variable=0反之當1, 再run regression model? 如果如此是用phreg還是logit+strata?

感謝池大師
回覆刪除
回覆
學生哥2017年11月20日晚上11:09
用了9小時研究一個新factor - “賽程欄位勝出率”，將田草1000A1檔、1200A1檔等等分開，每個路程檔位分開來計。很洩氣，無論如何調整都factor唔significant。反而唔咁細分賽程只計檔位勝出率，突然變得很significant。
池兄有咩睇法?
回覆刪除
回覆
匿名2017年11月21日下午4:00
其實chi sq 同 r sq 在模型裡哪個較重要?
回覆刪除
回覆
匿名2017年11月22日凌晨12:09
池老師, 看到你以前答覆過所有factor都會take log, 這是為什麼呢? 純粹為了fit model?
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

2017年11月7日 星期二

軟肋

183 則留言:

2017年11月7日星期二