2017年11月7日 星期二

軟肋

暑假前有blog友留言直指池某“唔識馬",所說的是事實,一直以來池某忙於計數、砌model,反而忽略了這個遊戲的主體對象。在此要特別多謝blog友坦誠指出池某的弱點與不足。“抖暑"期間,池某找到了一位以傳統方式賭馬的高手,補強一下這個軟肋。

高手以賭WP為主,沒有使用統計模型,也沒有使用Kelly Criterion,每場只押注一匹馬,近年每個馬季都保持七位數字純利,且每季續有進步。

傳統方法與統計模型能否兼容呢?細談之下,才發現大家的計算方法和投注策略並沒有大分別。高手雖然沒有使用統計模型,但他的做法同樣是羅列了一大堆factors,然後根據累積的賽果不斷微調這些factors的比重,只是沒有經過做regression這個過程而已;另外,高手雖然沒有直接使用Kelly Criterion,投注策略的背後意念與Kelly Criterion還是非常接近,其具體做法是,先定下一個相對於本金結餘的投注比例區間,然後根據所選馬匹的機會率與賠率,在區間的上下限之內選取一個比例下注。

如果要比較大家的不同,池某覺得很像中醫與西醫的分別。高手像個老中醫,可以憑經驗根據有限的factor快速準確斷症,執藥的劑量也較靈活隨意且具針對性;池某的做法則像西醫,任何情況都要把整套程序由頭到尾走一遍,遇到特別的情形也不能變通,好處則是即使碰到複雜混亂的局面都不會增加自己的精神負擔,長期作戰亦沒什麼壓力。

統計模型明顯不及傳統方法之處,是對初出馬的估算,缺乏足夠數據之下,model對初出馬的計算完全是無能為力,傳統方法則或多或少算是有法可依。高手對此尤其擅長,他非常關注馬匹特別是質新馬的賽前部署,由馬匹抵港隔離檢疫露面出操就開始追蹤,例如今季的一出即勝的“同得福"、“電子大師"等等,都逃不過他的法眼。

但如何將傳統的決策邏輯變成可做regression的數據是一個問題,比如晨操,傳統的做法可以根據功夫是否完整、有否缺課,甚至跑姿、毛色等主觀觀感,綜合出“好或唔好"這樣的判斷結果,這些都不容易以完全客觀的數字來表達,而且馬匹的晨操還包括了試閘、快操、踱步、游泳等項目,簡直是混亂凌亂,無從下手,故晨操一直是池某的model所欠缺的一塊。

在高手的引導下總算為model補足了晨操這一塊,且在這種縱向思維的刺激下思緒如泉湧,一下子為model新增了近20個factors,以前所未有的鼎盛陣容迎接新馬季開鑼,結果是──輸錢!

下回再談。

183 則留言:

  1. 池兄,好高興見到你的新文。如果將馬晨操同狀態量化,的而且確是個難題。希望你繼續努力,有新的成果同我地分享。

    回覆刪除
    回覆
    1. 多謝。
      問題應該解決了~~卦?(不敢講得太肯定,再觀察一段時間吧。)否則池某哪有閒情敲文章,肯定仍在棟起床板、懸樑刺股、搜索枯腸...XD

      刪除
    2. 池兄沒有先 Backtest 才用上戰場上嗎?

      刪除
    3. 退役馬啲晨操紀錄無晒, 點處理呢?

      刪除
    4. //Backtest
      logit model做Backtest會害死自己的,因為即使做錯結果都肯定係靚絕。

      刪除
    5. //紀錄無晒
      search下就有。

      刪除
    6. 哪如何判斷模型的有效性

      刪除
    7. 贏錢就係有效,輸錢就係冇效。XD

      刪除
    8. 真係search 下先有XD
      又要寫過另一個parser

      刪除
    9. :)
      馬會要作大家心照不宣的用途,大家亦心照不宣地坐享其便好了。

      刪除
    10. //logit model做Backtest會害死自己的,因為即使做錯結果都肯定係靚絕。

      點解錯結果都肯定靚絕?舉個極端例子,整個模型只有一個factor: 馬名。

      Backtest應該唔會有好結果掛?

      刪除
    11. 問題係呢個係咪統計有效o既model先。
      統計模型最難搞的係,用返一個database計出的parameter estimate來解釋返呢個database的data,結果肯定是完美的,用來應對未發生的事卻不是這回事。簡單地說,統計有效不代表實際有效。

      刪除
    12. fit得出嚟一定靚,我估HM嘅意思係out-of-sample testing。

      刪除
  2. 原來馬是可以游水的, 長知識了. :)

    呢篇文幾有意思, 也間接反映了現在傳媒經常力推的'機械可以完全取代人類'的膠論'是不可能實現的. 其實現在大多的machine learning的方法是取決於大數據. 技術上的algorithms/statistics等, 早已在數十年前出現.近5年大大改善, 只是因為電腦擁有的海量數據比從前大數萬倍. 技術上已沒有什麼新意了. 但我們不能忘記, 世界上很多事情是需要人們在不夠數據下的情況做決定的.

    很簡單一個例子, 現在很多新軟件中文輸入法, 是希望做到tailor-made, 即是從一個人平時在手機打字, 或用的app,或點擊的網頁/搜索等等, 得到足夠數據去預測一個人將會打或用什麼字, 用以增加輸入法的速度. 但要拿到足夠數據, 相信憑一個普通人打一世字的數量也不足夠.

    回覆刪除
    回覆
    1. 是的。前兩天看一個電視節目,介紹一位日本老木匠,能造完美的木盒,蓋子蓋上後密不透氣。老木匠說能做到完美不是靠經驗也不是靠技術,而是靠每一下刨木的「手感」,machine learning可以學到「手感」嗎?

      刪除
  3. 以股市做例子, 周不時出現的供股, 分拆, 私有化等, 的確會做成市場錯價而產生投資機會, 而公司生意,管理層決定等,全是互動因素, 這一些因素不可能因為過去股市的海量數據便可成功預測, 我個人不認為機械可以找到這一些套利機會.

    回覆刪除
    回覆
    1. 機械式rebalancing應該遠遠好過機械式預測。XD

      刪除
  4. 池兄:

    即是你的model現在就有50多個factors? 純粹問一下,你是如何解決難題的? 重用舊model定係再加factor以stabilise新model?

    回覆刪除
    回覆
    1. 現在係50幾個,之前係70幾個。未確定是否完全解決問題,遲D再寫。

      刪除
  5. 賭人認為無論用regression model定deep learning對賽馬做stat/prediction 都唔能夠全完避免randomness 的影響

    回覆刪除
    回覆
    1. 完全中point。不過data和有效factor足夠多時可以抑制randomness影響的波動範圍。

      刪除
  6. 池某, 我想請教關於半自動投注的問題。 怎樣從EXCEL把計算金額 去到馬會投注?可以SHARE一下嗎?
    今天R2 R6都中!!但因為沒有半自動投注的關系都錯過了幾過億.

    求指點迷津

    回覆刪除
    回覆
    1. 技術問題池某唔識,都是直接使用IT人的作品。IT人連全自動系統都有,兄台肯出幾個億佢應該會接你生意。

      刪除
    2. 莫講話幾億, 攞幾球出嚟你請成條 team 幫你做都得啦! ... 呵呵~
      IT人

      刪除
    3. 寫program 扮browser send GET/POST request 去馬會

      刪除
    4. IT人, 可以分享下自動投注嗎?
      我試了用iMacro click X,Y來做, 但效果不理想.
      因為馬會用的是java + Silverlight.

      救指點, 點將用excel + vba + imacros 做自動投注.
      如果可以請分享一下程式,如果不可亦請教教小弟詳細該用什麼程式去寫...

      麻煩晒...Thanks.

      刪除
    5. 下?而家仲silverlight?千祈唔好比IT人睇到,肯定佢會恥笑你。

      刪除
    6. 原來轉左...哈哈! 池兄點算係冇IT知識,已經比好多人知得更多!

      刪除
    7. 兄台冇句真話,最好不要招惹IT人,以IT人的脾氣,如果佢肯搭理你,最正常的答案係一串粗口。

      刪除
  7. 池兄:

    最近開始進行了自己少少研究,在這個blog獲益良多。想問一下,你用的應該是conditional logit model? conditional logit model同multinomial logit model有乜分別? 以我的理解,multinomial logit model是用於多個possible outcome,但是賽馬一係贏一係輸,為何很多作者說這是MLR?

    感謝回覆。

    回覆刪除
    回覆
    1. 唔係非贏即輸架,同時做埋二、三、四名,就係multinomial了。

      刪除
    2. 池兄你的MLR做到第幾名?

      刪除
    3. 早期比較貪心,始終做不到好的效果。現在集中只做頭馬,簡單logit model就夠用。

      刪除
    4. 名次是Ordinal data,multinomial model 可能要改一改。

      刪除
  8. 完全同意賭馬必須識馬,跑馬就是跑馬唔係跑人。雖然的確有「做馬」情況,但主使做馬「楊先生」自已都輸錢,這証明「做馬」只不過是一個冇效factor。池兄,模型加「識馬」這肯定是最佳出路,恭喜!

    回覆刪除
  9. 池兄﹐請教 組合獨贏對初學者來講會唔會較容易小試呢?

    回覆刪除
    回覆
    1. 沒有彩池是容易的,組合獨贏比獨贏還多了一個計算步驟。切勿為賭而賭。

      刪除
    2. 組合獨贏應該係要將所有馬individual probability計算出黎再做多一個step。風險好似係降低了,因為一個組合通常有2-9隻,只要其中一隻贏就派彩,但係計算過程又長了,error機會又多了。

      刪除
    3. 風險系細左但同時回報也縮佐水,更有一些你不想買的馬包括在內,白白浪費注碼,這根本是個沒有投注價值的彩池

      刪除
    4. 其實當初馬會搞呢個彩池係為左等公眾少D被落飛黨影響, 又可以少D注碼買多D馬, 賠率又被人感覺上好似穩定左, 但熱門又偏熱, 買冷門咩回報又少, 真係靠賭搵食既應該不會考慮呢個彩池.

      刪除
    5. 馬會主要係想將賽馬推廣比d六合彩客就真
      岩岩出果排 賣飛d姐姐係咁sell人買10蚊添

      刪除
    6. 換一個角度睇,投資/投注不過是一個找錯價/edge的遊戲,在一個「被平均」的彩池中連edge也被平均了,贏錢的機會只會細左唔會大左。

      刪除
  10. 其實有冇3揀1既投注金額資料?馬會網站只有獨贏包括3揀1既金額,比較有興趣知道有幾多人到底會投注3揀1...

    回覆刪除
  11. 概念係: 如果找到因素分析出某幾場熱門組合過熱/頭馬機會低﹐再加投注分配得宜﹐長遠計能否正回報?

    回覆刪除
  12. 二個系合併彩池,你買組合獨赢和買獨贏賠率是一樣的

    回覆刪除
  13. 想請教池兄
    本人是用kelly的, 遇到的問題是本來那匹馬kelly建議可以買的, 但隨著ro不斷熱而慢慢變得不值買, 特別是有時遇到綠啡格, 最後搞到kelly叫不要買了.
    理論上落飛黨應該是覺得有機會才會大量落飛, 但卻影響到變了過熱, 這問題是我的eo計算不夠準才會這樣嗎?

    回覆刪除
    回覆
    1. 係搶食的人太多,今日盈進、英明勇將、大籐王最後都被人劫去一截。
      用2 step model可以稍稍減緩啡綠格的衝擊。

      刪除
    2. 請教池兄, 如果把one step model 改成two step model?

      刪除
    3. 將1 step的結果同賠率做多一次regression。
      之前有blog友post過一篇論文,好詳細咁比較1 step同2 step,不過池某唔記得在邊篇文章的留言。

      刪除
    4. 池兄 請問你今天有多少回報率?

      刪除
    5. 純利相對於投入金額是15.12%

      刪除
    6. 今日很幸運有純利相對於投入金額62.22%..但我用的是ONE STEP MODEL, 不是TWO STEP

      刪除
    7. 池兄個DATABASE太強, 英明勇將、大籐王 這兩隻熱門都計到!!

      刪除
    8. //62.22%
      probit model定logit model?幾多個factor?用幾大kelly比例?

      刪除
    9. //DATABASE
      database只有客觀data,無強弱之分。

      刪除
    10. 我只是用隔夜賠率作參考,假設馬會計的是expected odds. 現在才開始研究database

      刪除
    11. 兄台唔係用1 step model咩?冇database點會有model?
      用隔夜賠率作expected odds又點可能有62%回報?

      刪除
    12. 看來我誤解了one step model. 現在還沒建立database. 我確實用隔夜賠率作expected odds.
      八場裡 只買中R1 R6 R7 R8.因為落飛關系r1 r6都要輸錢.
      全日用了3400 投注,扣了本金純利為2115.5

      刪除
    13. R1 盈進 隔夜22 閘前22 最後10

      R6 英明勇將 隔夜8.4 閘前7.1 最後4.8

      R7 西方快車 隔夜2.8 閘前2.9 最後2.7

      R8 金太陽 隔夜57 閘前48 最後58

      用隔夜賠率做eo任何一場都不可能中,因為馬會會抽水,賠率轉eo之後會更冷,完全冇edge。

      刪除
    14. 盈進19
      英明勇將5.7
      西方快車1.2
      金太陽17
      我既隔夜賠率

      刪除
    15. 任意截取一個時段的賠率無異於賭大細,揀中「赤兔寶駒」1.5倍那個時段就死直。

      刪除
    16. 之後有人買咗50萬,成晚2倍樓下。

      刪除
    17. Steven, 你是截取隔夜賠率做expected odds,然後按照「http://poolshunter.blogspot.hk/2016/03/gun-pit.html」中池兄方法做kelly嗎?

      刪除
    18. 池兄, 我用的是開盤12點正的賠率, 假設馬會計算的是準確.

      刪除
    19. Steven兄:

      那些999賠的你如何處理? 還是當它為eo嗎?

      刪除
    20. 隔夜賠率絕對不宜作任何參考用途
      以前曾經聽過有朋友講笑咁話, 搵幾個人一人夾一萬幾千, 開飛頭一兩小時落注, 所有馬經嘅隔夜賠率全部由佢地控制晒, 成就感一定好大

      刪除
    21. 近年多左人刻意用隔夜賠率擾亂視線的

      刪除
  14. 請問池兄, 明天海外賽事S2 可找到初盤的參考賠率嗎?
    馬會只提供S1 參考賠率,並沒有提供S2的....

    回覆刪除
    回覆
    1. 冇諗過去搵,呢D賽事級數太低,大莊都不感興趣,有都唔敢用。

      刪除
    2. 咁明天只玩S1賽事, S2 賽事就放棄嗎?

      刪除
  15. 「中醫」和「科學化後的中醫」,後者雖任重道遠,卻更勝一籌。
    憑感覺看晨操可能頗有用,數據化後的晨操應該會更有用。
    我也有想過把類似的資訊數據化,但除了操練頻率之外就不知道何處入手。
    似乎與晨操相比,試閘數據會比較容易使用?

    回覆刪除
    回覆
    1. 晨操同試閘數據化後都係效果弱而波動大,要凸出效果就會同時加大危害,要控制危害就會搞到冇乜效果,好難平衡,仍在努力中。

      刪除
    2. HAHA.... 我還是統計學的門外漢, 但搜集資料應先考慮資料的準確性....
      比如晨操的時間, 馬會(晨操服務社)同蘋果打錶是兩個不同時間, 那竟然那個才是"較"準確, 要知道打錶員咬個包後才按停個錶, 可能已相差0.5秒, 在這樣的非科學作業下, 這些"數字"不用統計也知道統計角度上應無意義.

      小蝦米上

      刪除
    3. 蝦米兄真細心,蘋果同馬會唔止時間唔同,連晨操內容都唔同,快踱變快跳,快跳變快踱。不過用得晨操資料應該都唔會太在意跳出的時間,因為不會有馬匹在晨操時是出盡全力的,反而如何說明一匹馬「操唔操得」更關鍵。

      刪除
    4. Error 很大的數據的確不應該直接使用。

      但總不能因為有人 hea 計時間就因噎廢食,完全忽略這些試閘和操練的數據吧。

      畢竟
      1) 有報告提及試閘是否合格(有些情況是試閘不合格就不能出賽);
      2) 池兄的「中醫師」朋友透過晨操來評估新馬水準有一定準確性,

      反而我覺得重點會是我們應該如何從這些亂糟糟的數據 mining 出有用的東西。

      比方說,原來考慮體重變化是否合理時,晨操量是因素之一。或者某馬長期休戰,操練和試閘可以用來粗略評估牠有沒有因此有水準下降等。

      不過我其實也不懂,到底除了操練量之外,還有什麼可以從中 mine 出來。

      刪除
    5. mine晨操data最痛苦的是個個練馬師的操練手法都不一樣,沒有一套標準的程序可依,不知道應該向哪個方向梳理亂糟糟的數據。

      刪除
    6. 池兄:

      您以前的model是完全冇包含晨操的嗎?還是能保持正回報率?

      刪除
    7. 係。季初加了晨操反而輸錢。哈哈。
      不過晨操部份應該不是導致輸錢的原因。

      刪除
    8. 池兄,如果將你今季初投注過莫雷拉的馬匹抽出來看,是否得到負回報?而上季則是正回報?
      小蝦米

      刪除
    9. 另外,抽出羅富全頭馬的場合,會不會這類場次也是負回報呢?
      小蝦米

      刪除
    10. 大致明白蝦米兄的意思,池某是非常注意不讓騎師或練馬師等個別factor dominated整個model的。
      過去的投注紀錄沒有這樣詳細分類,從最近的賽日來看,抽出雷神的注碼是正回報,羅富全的馬匹全部沒有投注。

      刪除
    11. 謝謝回答. 羅富全的問題我可能問得不好.
      我是預計池兄不會投注羅富全的馬匹, 我是好奇羅富全有馬出賽時, 池兄有沒有投注該場賽事, 這樣問會較清楚.
      畢竟羅富全現在20W, 是榜首, 買不到這20W任何一W都不是問題, 但羅富全有85次派出出賽馬, 這85次的場次會否就是負回報其中一個因素呢?
      另外, 回應一下Leba兄, 晨操應是有用而直觀的, 細心研究不是問題, 不過在既有資訊是否已做好 DATA mining呢. 如果既有資料都未消化熟讀, 如何能運用甚至APPLY在統計軟件上.
      我知道池兄是用馬會公佈的標準時間做比較, 但所謂的標準時間, 是否標準? 用什麼做標準? 有沒有ERROR存在? 就算是準確, 精度又是否足夠乎?

      小蝦米

      刪除
    12. 羅富全問題,11月1日全泥地賽事之前,投注羅富全的馬匹相當多,是11月之後他的馬都明顯熱得不合理才很少找到投注機會。
      標準時間問題,其實並不需要理會那個時間標不標準,我們需要的同場的參賽馬有同一個固定的reference做比較,這才是關鍵。

      刪除
    13. 我理解蝦米兄的憂慮,小弟其實正是想討論到底如何從晨操「Mine」出有意義的資料。不過如果按蝦米兄說,除了次數之外,其他相關資料也沒什麼好 Mine 的話,也沒辦法了。

      至於標準時間方面,我的看法是,其實你不需要知道每匹馬的絕對強弱,你只需要知道相對強弱就夠了。
      舉個例,馬會的「速勢能量」可以用來衡量一隻馬的強弱程度,如果某場當中,所有馬的「速勢能量」全部被減 20 分,那麼牠們之間的爭勝機會應該不變才是。
      標準時間也類似,所有馬都被低估了 2 秒,那麼其實與所有馬都沒被低估是沒分別的。

      如果蝦米兄是理科出身的話,以「位能(Potential energy)」來比喻就很好懂。我們考慮物件的運動時,往往只需要考慮它的位能變化即可,它本身的數值是什麼,很多時都不重要。所以位能的「零點」可以隨你定。而馬會的標準時間就像是位能的零點。

      刪除
    14. 話說,提及到策騎風格,其實我有想過寫一些 Neuro-network 出來,自動把不同組合歸類,使同類的馬會有類似的性格且受到類似的操練和策騎風格。但一想到 Neuro-network 要從零開始學,人就會懶,然後就作罷 XD
      也許可以憑經驗逐隻馬以人手去分。但這工作要花的毅力和心血也會讓我作罷 XD
      所以小弟很多時也佩服池兄可以曠日持久地與 Data 搏鬥。

      刪除
    15. 晨操問題池某也希望可以集思廣益,除了次數之外,大家會睇一匹馬賽前幾多日或多長時間的晨操表現?池某不斷嘗試還是不得所以。

      刪除
    16. 曾用試400米閘在50秒內完成的作為指標,亦曾有利潤且賠率非常吸引

      刪除
    17. Leba兄, 謝謝詳細回應.
      可惜我是商科出身...數學暫時停在初中水平, 相信日後還向下移...很難想像用標準時間去代替"mean", 不過賽馬有趣的地方就是這里, 各施各法。
      在此我分享一些小經驗, 以往18台除了有出賽馬的晨操外, 還有其他馬近一日兩的快跳情況, 我會錄影然後"每匹"寫下自己的晨操及試閘心得(二三十字), 當馬匹要出賽了, 就會load晒所有筆記, 看他"快試"的準備, 備戰, 但"自己評語"的變化.
      我的觀晨操心得是 "不重形而重傳神", 時間快當然好, 時間慢亦可能有好馬, 時間快跑得吃力者亦不少.....反正出腳,身輕,火氣很難量化出一個級數....我就是憑這種勤力的筆記, 在十多年前贏出一個全港貼士比賽的冠軍, 所以我一定不會否定晨操的有用性.
      後來在一些網絡認識一些馬友, 當中有個真人不露相的高手, 此高手相信現時已成為本港職業集團的重要一員或顧問了. 我們不算相熟, 但他是我的假想敵 (人類這種生物要有追趕目標才會加速進步, 大量卡通片可作教材), 有天他亦替職業集團問我, 我的晨操評語可有幾季的評級給他們作研究, 可惜我筆錄下的只是文字, 沒有評級, 因此沒有成事......ANYWAY, 要將晨操量化, 真的不易, 因為馬匹狀態好不好跟操練手法不一定成正比, 有些唔夠FIT的馬要加辣, 有些FIT的馬慢踱谷下心火就夠, 搬去快跳會唔會反而"用多左"? 同一馬房有不同体質的馬, 正所謂因材施教, 真係用同一方法就可以通用訓練嗎? 難矣.....
      最後祝研究晨操的朋友成功.
      小蝦米

      刪除
    18. 講到馬匹操練,老賭徒又可以分享一下舊經歷。程式計馬老某今次不是第一次,在大約十年前,用騎練勝率+速勢指數(舊版好過新版)+ 操練評分,作核心計算排名,效果相當滿意。操練評分不是本人手筆,是用錢向「天樂論」作者天樂訂閱的,「天樂論」是一本講述各馬房操練手法,書中詳細說明每個馬房都有自已操練必殺技及規律,如要將必殺技量化,就要熟悉所有馬房操練手法,你話難唔難?傳統高手只留意大馬房或者需跟進馬匹的操練,然後用排除法,但用MLR模型就不能了,要將有份參賽的馬匹量化,才可輸入模型,多費時啊。老某有一小第,是傳統方法高手,昨晚他推薦給我四匹馬,「幻影飛鷹」、「得其康」、「招多福」及「小米周」,但老某的模型只計到「招多福」及「小米周」有edge。加上上周「軍歌」,推薦原因是十三哥連續快操多課,這情況是極小出現,試問這現象又可以怎樣量化。

      建議池兄可以閱讀一下「天樂論」,雖然已經過時,但這書是比「計得精彩」還早的賭馬工具書,書中內容對「不識馬」的池兄來說是極有參考價值。

      肯定有師兄會問,老某說第一代計馬方程式效果相當滿意,為何失效?原因是提供操練評分的天樂,因健康原因在半年後停止提供,引至程式計算失準而棄用。這事件令老某明白了兩個事實,一)証明操練評分在模型的重要性。二)不是自已擁有的能力,借用他人的是有限期的,這為何老某現在要「親自下廚」的主因。

      刪除
    19. 天樂論....勾起我的陳年回憶了, 記得他問過如何能克服心魔馬, 好像我的回答令他最滿意...呵呵, 真的要認老了.
      小蝦米

      刪除
    20. 哈哈,小蝦米兄的確係一等一高手,日後要多提一下。

      刪除
    21. 蝦米兄同老賭徒兄都係前輩高手。:)

      刪除
  16. 想問版主是用SPSS還是SAS? 方便分享一下有哪一些factors嗎?

    回覆刪除
    回覆
    1. SAS
      Factors很大路,騎練、名次、完成時間、檔位等等,都是在馬會網站找得到的資料,沒有要自己睇片打錶的。
      這個問題在前面的文章已經談論無數次了。老實說,要池某像個阿婆一樣把同一番話重複又重複,池某也會不耐煩的。

      刪除
  17. 請問 ,
    我用excel 2007 嘗試用 vba錄製並下載馬會"馬匹資料” ,為什麼不成功,請指點!

    回覆刪除
    回覆
    1. ......無言
      冇試過咁做,答唔到......

      刪除
  18. 那麼,請問你是怎樣下載馬會的"馬匹資料"?

    回覆刪除
    回覆
    1. 昨天答過了。早期是copy and paste,現在是用IT人的自動系統。

      刪除
  19. 池兄:

    伸手黨多只是因為您有料,大家想跟你搵錢,別太上心!辛苦了。
    另外奉勸一下大家,問問題之前睇下其他post的comment,無謂一個問題問幾十次。

    回覆刪除
    回覆
    1. 多謝學生哥兄關心。像兄台這樣有同理心又富正義感的人已經很少見了。

      刪除
  20. 呢位"學生哥”得罪了很多人亦侮辱了很多人。
    別人來看的是Blog, 亦不用你插嘴, 始終係一名學生哥不懂世道!
    如果Blog主認為有伸手黨,可以書面拒絕一切回答。 學生哥實在太多嘴。

    回覆刪除
    回覆
    1. 不會得罪很多人啦。大多數blog友都是作認真而有建設性的討論,求分享、求指教、求指點的來來去去就是那麼幾個,而且很可能就是同一個人的分身。
      很多「蹺妙」都是要自己落手落腳做過,誠實面對,經歷過挫折、痛苦,甚至輸過錢才能領悟的,老賭徒兄分享的經歷就是很好的例子。未付出過努力就想將別人的成果據為己有是不可能的,即使將完整的答案擺在他們面前,他們都不會理解精要的所在,他們以為不斷追問就能得到想要的答案,其實他們所提的那些缺乏實踐體會的問題本身就是遠離答案,只是在無關痛癢的末節打轉而已。

      刪除
    2. 匿兄:

      那就容許我「插嘴」多次吧。
      如果您認為我言論冒犯及得罪了您,本人謹此致歉。無謂在呢個平台上傷和氣;大家都係上來學嘢,尤其係對比起池師兄我哋大部份都係「學生哥」。只不過係睇唔過眼啲人乜都問,仲要係一條問題問過幾次都唔睇番繼續問。連池師兄在回應時都語帶無奈甚至不耐煩了,「我得罪了的那些人」是否時候應該收斂下呢?
      無可否認池兄blog係一個比我哋好好學習嘅地方,我地來到這裡如果與一眾blog友作更高層次的學術性討論,相信會更有意義。
      另一方面... 大家記得點解師兄9-10月冇出過post嗎?其中一個原因大概係因為有太多伸手黨嘅無理要求轟炸師兄(如有錯請指正)。真心希望大家當幫幫師兄手又好,幫幫其他想做研究嘅又好,幫幫其他想睇師兄分析嘅都好,最起碼爬吓文先問問題,呢度大把高手已經其實解答過大家問題,無必要事事comment討論。
      如果我再冒犯到大家,我在此再次致歉。

      刪除
  21. 非常同意池兄的見解,砌Model 最大的樂趣係享受當中的過程同埋解決問題後的成功感。其實砌Model 過程中你會學到Excel 函數、VBA、統計軟件(如SAS) 等知識,呢D知識對工作上幫忙好大(如果閣下係文職)。所以即使個Model 最終幫唔到我羸錢,我都覺得係賺左!

    Dicky上

    回覆刪除
  22. 條友仔又唔爬文,仲下下伸手黨求分享,無_嘢呀話?老馮架?就算俾埋你都唔識用啦!你睇老賭徒,咁大年紀都自己一手一腳搞掂,你條友醜唔醜呀?

    路過都睇唔過眼

    回覆刪除
  23. 問一句就畀人鬧到懵!!!
    還記得無線有套劇集叫”絕代雙驕”,惡人谷內有一個叫做”小魚兒"的人。 難道”池裡漁”就是”小魚兒"???
    只可說
    神亦是你鬼亦是你!

    回覆刪除
    回覆
    1. 是問的惡還是答的惡大家有目共睹。
      對無意義的留言請恕以後不再一一回應,實在沒有那麼多時間和精力可以浪費。
      對來搞事的,必刪,不會再事先警告。

      刪除
    2. 網誌管理員已經移除這則留言。

      刪除
    3. 不好意思,「路過都睇唔過眼」兄,粗口留言都要刪,不是立場問題,而是呢度會有小朋友來睇,請見諒。

      刪除
  24. 支持池兄 x 2

    Dicky

    回覆刪除
  25. 請問一下池兄
    閣下的模型通常贏的是本來機會率很高的還是經過kelly處理後一些機會率本來沒很高的?

    回覆刪除
    回覆
    1. kelly 不會影響概率

      刪除
    2. 致HM 謝回覆
      kelly是不會影響概率, 但本人想問池兄的問題是多數贏錢是靠 "本來計算概率就很高的馬" 還是 "經kelly分配注碼後 本來沒有那麼高概率 但kelly也建議下注的馬"

      刪除
    3. 對的,Kelly只決定注碼分配,不會改變機率。輸或贏、贏多或贏少取決於EO與實際賠率間的差距,亦即取決於別人的犯錯程度。當然本來機會率很高而又有edge的注碼會大一些,但具體回報很難說哪種情況大些。

      刪除
    4. 謝池兄分享
      看來是我eo計得不夠準了, kelly常常叫下注用機率不算高的馬, 命中率跟機率高的只是一半半而已

      刪除
  26. 池老師你好,我計孖寶半全場無論頭場或尾場,上半場經常都係0:0, 1:0 或者 0:1,你有冇遇到呢個問題?
    有冇話特登避開某些波膽?

    回覆刪除
    回覆
    1. 很正常呀,半場就是這些組合機會大些,除非兩隊球隊的實力非常懸殊。
      不會特登避開某些波膽,但現在彩池投注額太少時會避開不買。

      刪除
    2. 今晚加埋多寶有超過九百萬,值得買吧。一齊加油!

      刪除
    3. 九百萬?邊可能,六合彩就有。

      刪除
    4. 啊,我打錯,係90萬。但係話口未完,破一百萬了。

      刪除
    5. 池兄 里爾這口 中嗎?
      其他都計到,就是3:1 計不出😭😭

      刪除
    6. 里儀3:1都計得中嗰$70真係勁。我過咗3關,就係冇3:1呢個比數��唔知佢地係唔係亂填撞中呢。

      刪除
    7. 米玩啦,3:1呢D波膽邊可能計得中呀?池兄寫完呢篇孖膽blog,真係多咗好多人一齊去計,問題個計法並非萬能,一開大波膽,主客,客主呢D波膽就9成9計唔到!咁邊個中?米一班博冷份子,佢地未必成日中,但中一次就有排玩。。。

      刪除
  27. 請問池兄賭馬Kelly 個amount 係用fixed 好似10000咁,還是根據每場輸贏 增加或減小amount?

    回覆刪除
  28. 池師兄、老賭徒師兄:

    最近在你們的blog上面看到用iMacros來投注,我大致明白如何運作。然而想請教一下兩位老師,你們是如何解決馬會網站要求輸入安全問題答案的呢?我試運作過iMacros,好似冇辦法輸入正確的安全答案。

    回覆刪除
    回覆
    1. 池某沒有使用iMacros於賽馬投注,IT人寫了另一個無關iMacros的全自動投注系統,只要開著電腦就會在開跑前自動登入、計算注碼、下注、計算結餘、登出。不過池某不喜歡用這套系統,原因是太自動化了,顯得自己像個廢人。XD

      刪除
    2. 某程度上,池兄的這種方法也是幸福的一種。:)
      不才暫時沒有足夠IT的知識寫全自動投注系統,唯有用一些現成的半自動投注方式。唯安全問題答案這個問題實在「R爆頭」都想不出解決方法。

      刪除
    3. iMacros 處理唔到安全問題的,不過老賭徙不會考慮用全自動下注,因為賭馬是老某的興趣,所以一定會現場下注的,如有事當日會放棄投注。

      刪除
    4. 關於 [安全問題答案] iMacros 肯定是無能為力 (不用再花時間去想了!), 若要追求全自動登入, 必定要用其他工具 (再鑽研下去必定要識 coding!)。小弟也是基於個人原因才用上全自全動系, 而且也會有不少限制, 識賭馬如池兄, 老賭徒真係送畀佢都唔會用! 但製作過程頗繁複 ([安全問題答案] 的確係最難攻破!), 由零到半自動下注, 到全自動下注, 現甚至可於手機監視下注情況, 那份滿足感真是非筆墨所能形容! 最後一句: 若非有相關 coding 經驗, 別妄想可以在這裡隨便問問就可以有答案, 一定靠自己努力學習鑽研才能有成果!
      IT人

      刪除
    5. IT人真係好勁!
      想問下你係用什麼code寫全自動程式? JAVA , C?
      果份滿足感真係非筆墨所能形容🤣🤣

      刪除
    6. 作為IT外行人亂估,應該唔係用單一工具解決哂所有問題卦,早排聽IT人一時話要研究smalltalk一時又話要研究C#。

      刪除
  29. 請問池兄一般來說, 模型裡騎練這2個參數, 參數值互相比例大概是多少才算比較合理而沒有讓任何一方過強呢?

    回覆刪除
    回覆
    1. 呢個問題,真係答唔到。而且每更新一次賽果就會變得不一樣,只知道做出來是騎強過練的,但這也沒什麼不合理。

      刪除
    2. 我有時做到1:3 4:5 1:6, 1:21也出過 :(
      但奇怪都是練強過騎, 或許是我為了減弱雷神效應故意log了騎的勝率
      真是煩惱不懂取捨

      刪除
    3. 我也是練強過騎,同樣是log了騎的勝率。但是我的model還算是正常運作呀,沒有因為這個似乎錯的factor而輸錢多。

      刪除
  30. 如果用無處理過的騎練勝率放人Model,一般都係騎強過練,但比例不會相差太遠。

    Dicky

    回覆刪除
  31. 謝各位意見
    無處理時的確是騎強過練, 而且我的是強很多(5, 6倍), 不知是不是我的問題
    所我想減少盲目追捧強騎師的影響, 所以做了弱騎強練的處理, 現在練強點大約1:2.5左右, 算合理嗎?

    回覆刪除
  32. 要視乎你有幾多factor 同有咩factor ,好難一蓋而論。不過只要你個Model 的factor 夠多自然可以攤薄騎司效應,無需刻意去做。

    回覆刪除
  33. 池兄係你個Blog 班門弄斧真係失禮晒!哈哈
    今日戰果如何?

    回覆刪除
    回覆
    1. 今日只中1、5、10場,要輸錢。

      刪除
    2. 池兄是否完全依賴kelly來下注, 就算有些馬明明都幾高機率但kelly唔叫買就會唔買?

      刪除
    3. 係。所以好多隻大熱都冇買,雖然計出來的機率是最大。

      刪除
    4. 原來是這樣 謝池兄
      還想再問一下, 白白的模型裡機率是最大的馬經 2 steps處理後, 通常都還是最熱又機率最高那匹, 搞到都不知如何搞, 請問是我的beta推不動alpha的結果嗎?
      然後白白的 2 steps處理後基本上機率都是伯歸邊只叫買1匹而已, 請問池兄是否如此?

      刪除
    5. 池某比較少遇到歸邊重錘的情況,印象中今季只有一隻「旺蝦王」是這樣。

      刪除
    6. 池兄 , 為什麼計出來機率最大 卻冇買?
      EO 大過RO?
      今日我中R1 R2 R7 R8 R9 搵到小小零用用🤣🤣

      刪除
    7. 白白審視過自己的模型, 發現 2 steps後的adj eo最熱或最熱果隻永遠都是1, 很多場都是這樣, 搞到kelly完全歸邊, 這種情況是不是說明模型效益很低?
      >.<

      刪除
    8. 無論是1 step還是2 step,大多數場次的eo都應該與實際賠率相差不遠,因為其他的投注人都不傻。

      刪除
  34. 池大師, 有一個問題我還是不太清楚如何面對。
    問題其實非常直接: 在做那個model的時候, 是直接用binary logit regression, 將每一隻馬的factors拆開成為不同的independent variable, 如果輸了就當dependent variable=0反之當1? 還是要用到conditional logistic model, 把一場馬裡面的馬分成不同的strata, 例如一場的所有馬group在一起, 同樣的輸了就當dependent variable=0反之當1, 再run regression model? 如果如此是用phreg還是logit+strata?

    感謝池大師

    回覆刪除
    回覆
    1. 千萬不要稱大師,池某的文章幾乎篇篇都在調侃大師(們)。
      池某的做法是前者,run regression用phreg。

      刪除
    2. 感謝池兄的回覆。還有兩個簡單問題, 希望池兄不厭其煩再助我一臂之力...
      1. 如果用前者, 會否做成predict一場馬的時候, 馬win的概率總和不等於1? 到時再做簡單adjustment, 按比例把它調整到等於1就可以嗎?
      2 用前者, 就是一場馬的結果就會為model增添大約12-14組資料? (其中包括1組是win的, 其他全部是lose的) 製作model的時候用1000場賽事, 亦即是說會有大約12000組資料, 對嗎? 如果把它分成7成做製作model, 3成做back test可以嗎? 還是不需要back test?

      再次感謝池兄

      刪除
    3. 1.用regression得出的parameter去計算下一場的概率分布時,概率總和多數是不會剛好等於1,轉作EO前需要簡單地normalized一下。
      2.用同一組data得出的parameter代回去做back test沒什麼意義,結果一定是很好的,那只是自欺欺人。

      刪除
    4. 無言感激。看來我應該可以開始嘗試build model了。

      刪除
    5. 池兄 ,
      我跟據計得精彩裡面的,找不到方法一半DATA BUILD MODEL , 一半做TEST.
      想請教一下怎樣用BUILD出黎的MODEL做TEST

      proc phreg data=horse outest=betas;
      strata subject;
      model win*win(2) = LnOddR Runs JW JWD WRatio WRatioD JP JTrainP PLenB2 FirstRun LongRest ARTB2 WDiff2 PastPos2 Chdist RecentJR
      BarNo KernalB
      / ties=breslow;
      run;

      刪除
    6. 書入面有介紹點做R^2 test。

      刪除
    7. 池兄 , 書上面介紹的R^2 test係用excel試。
      我用上面D commend只係可以得出Parameter Estimate 和 P>Chi-Square.
      我怎樣可以得出賽前所估算那匹勝出馬的機會率.

      不是用sas 做train & test 嗎?

      刪除
    8. 將Parameter Estimate同相對應的factor相乘,再SUMPRODUCT,得出每匹馬的「分數」,然後normalize。

      刪除
    9. 池兄說的這個動作是EXCEL做,
      Parameter Estimate 這個數 會不會增加每一場的時候而改變?
      那我不是要每一次都要重新行一次parameter estimate?

      刪除
    10. 係。隨著data的增減,Parameter Estimate會不斷變化。

      刪除
  35. 用了9小時研究一個新factor - “賽程欄位勝出率”,將田草1000A1檔、1200A1檔等等分開,每個路程檔位分開來計。很洩氣,無論如何調整都factor唔significant。反而唔咁細分賽程只計檔位勝出率,突然變得很significant。
    池兄有咩睇法?

    回覆刪除
    回覆
    1. 比其他Sample size大的factors打散左,例如場地及路程,池兄在之前的文章有提及解決方法

      刪除
    2. 是的,上文的留言有談過呢個問題。池某不認為分得越細越好,sample size太細容易受到randomness干擾。

      刪除
    3. 題外話,池兄方便分享下回扣對你的投注有沒有影響?

      刪除
    4. 目前冇影響,池某將kelly比例set得好細,注碼普遍不大。若個model穩定下來就真係要諗下點樣食盡呢D優惠。

      刪除
    5. 係咪人手劃飛先可以食盡回扣?

      刪除
    6. 唔係。不過真係極難砌,仲未有頭緒。

      刪除
    7. 唔係人手劃飛先至可以一條飛買唔同注碼W咩?

      刪除
  36. 其實chi sq 同 r sq 在模型裡哪個較重要?

    回覆刪除
  37. 池老師, 看到你以前答覆過所有factor都會take log, 這是為什麼呢? 純粹為了fit model?

    回覆刪除
    回覆
    1. 不同單位的data,它們的scale也各不同,一概take log可令data沒那麼參差。

      刪除