2015年9月17日 星期四

強勁無匹的賭馬方程式

繼續搬家,此文從“舊居”搬來,原文發表於2014年1月8日:

馬迷研究賽馬博彩,“門派”甚多,數據派、晨操派、賽績論、狀態論、步速論,甚至陰謀論,各師各法,如華山論劍。然而,一個賽季或幾個賽季後檢驗各門派的成績,基本上會合流成一派──“馬後炮派”,各派理論用來解釋賽果都可以描畫得頭頭是道、天花亂墜,用來預測賽果,則是無能為力。

惟獨有一派,過去二十幾年每年都從香港賽馬彩池中獵取數以億元甚至十億元計的利潤。如果說賭馬有贏錢公式或贏錢方程式,那必然就是這一派如“九陰真經”般所向披靡的內功心法──MLR模型(multinomial logistic regression model)。

上世紀八十年代,William Benter、Alan Woods和Walter Simmons在香港合夥成立了一個賭馬集團,集團從1986至87賽季起大獲全勝,然後三人分家,各自分得一本“九陰真經”再戰江湖,很快各人都成了億萬富豪。

因為大嘴巴Alan Woods守不住秘密,江湖上有本“九陰真經”的消息很快就傳遍各門各派。於是,一個又一個苦練“九陰真經”的賭馬集團相繼出現,練成頂級心法的集團同樣每個賽季可賺走數億元。已經賺够的William Benter更是大方,到處演講公開其贏馬方程式,他十年前在香港演講的視頻現在在網上還能找到。

其實,就算他們不說,這個秘密也守不了多久,就在他們開始贏錢的同時,一篇在賭馬業內著名的論文就閃亮面世,那就是Ruth N Bolton和Randall G Chapman合著的“searching for positive returns at the track: a multinomial logit model”,有興趣看原汁原味的請到這裡:http://www.ruthnbolton.com/Publications/Track.pdf

前文談論Kelly criterion時曾強調,參與一賭局,主要看機會率和賠率兩個關鍵。賠率是公開的,應用入算式全無難度,難就難在機會率部份。要估算一匹馬准確的取勝機會率,比猜哪一匹馬能贏還難得多,這才是賭馬最核心的難題。

而MLR模型,正是直指核心的利器,一次過把全場所有上陣馬匹的取勝機會率算准,再以Kelly criterion進行最優化的注碼配置,“九陰真經”就是這樣練成的。

現在值得觀察的是,未來的華山論劍越來越參與者均以“九陰真經”交手,結果會怎樣?如果大家模型中有效變量都差不多,理論上計算結果也會趨於一致。

實際上,現在已經常出現這樣一個令人頭痛的情況:開跑前按最優化注碼配置重注的馬匹,總是瞬間賠率急跌。有時看到開跑前押注時有20倍的冷馬,開閘後變成4、5倍,真是暈得一陣陣!

==============================================

補充於2015年9月17日:

在原始落後的社會裡,武器的殺傷力差距不會太大,你持長矛,我拿弓箭,在不同的戰場環境中,互有勝負很常見。就如傳統的賽馬理論,晨操派、賽績派等等各有所長,可以誰也不服誰。

隨著MLR模型的殺入,戰場的形勢頓起變化,猶如熱兵器部隊殺進了冷兵器部落,長矛也好,弓箭也好,都難以與手持半自動步槍的熱兵器部隊抗衡,儘管初期的熱兵器並不太精良。據稱,William Benter等人最早期殺進香港馬場的MLR模型,相當簡單粗糙,只有16個有效參數,然而從1988年至1993年5年間,他們賭了2500場馬,資本竟大增了40倍,年複式回報超過100%。

與開放而透明度甚高的金融市場投資領域不一樣,賽馬投資領域的討論一直低調而神秘。每過一個時期,就會冒出一大堆關於金融市場投資的新方法、新知識、新技術和新理論,層出不窮;而這麼多年過去了,在賽馬投資領域,從寥寥可數的公開報道可看到,所有的成功例子,幾乎都離不開MLR模型,所謂的新進展,都只是這個模型的改良和優化,沒看到也沒聽說有更大殺傷力的新武器誕生,似乎至今仍是“華山一條路”,以致越來越多的賭馬集團擠在同一條路上厮殺,利潤也越來越分散。據說現在一些賭馬集團MLR模型獲取的有效參數,已多達130多個。另一個有趣之處是,幾乎所有的成功例子,都是在香港馬場取得的。

而另一邊廂,30年過去了,香港普羅馬迷日常所接觸到的賭馬知識和技術可謂沒有寸進,除了電視的轉播畫面清晰了一些,馬經版的印刷精美了一些,所用的方法和理論,還是30年前那一套。電視也好,電台也好,馬經也好,所謂的“專家”依然陶醉於鑽研以大刀木棒對抗機槍大炮,還將這種義和團精神大言不慚地稱之為“分析”,或自詡為“理論”。

賽馬投資的趨勢也日漸清晰了:仍然手持冷兵器的傳統“土著”,面對熱兵器團隊的強勢掠奪盤剝,基本上沒有翻身的機會,只能被撳住搶;而熱兵器團隊因大家計算結果的殊途同歸,利潤也逐漸被攤薄。“土著”們每每看著電算機的“綠格飛”或“啡格飛”馬匹勝出而欽羨不已,殊不知此時“搏殺得手”的熱兵器集團卻是啞子吃黃蓮──收益又被分薄了幾成。

昨晚的情況:



“榮光大道”計算時有41倍,跑完勝出只得27倍,利潤少了一大截。



“競駿高飛”計算時有17倍,跑完勝出剩14倍,已屬萬幸。

309 則留言:

  1. 你好師兄
    可唔可分享你既賭波/賭馬程式
    小弟已經輸到仆街,上網試過好多方法都係冇用
    如今只係想平返條數
    希望網主可以分享俾小弟

    回覆刪除
    回覆
    1. 兄台你好。在池某的認知之中,這個BLOG裡提到的所有方法和公式,本身都是沒有預測能力的,並不能計到哪匹馬或哪個球隊會贏,只是用來提醒自己,確定自己下注的時候是站在上風小小的位置,而非明知自己處於下風還去搏。
      所以,使用這些方法時是很被動的,輸或贏、贏多或贏少,完全取決於對手犯錯的程度(見“有限的運氣”一文)。如果對手不犯錯或犯錯比自己小,甚至會得不償失。要用這些被動的方法主動出擊去追數,是不合適的。

      刪除
    2. 咁師兄可否分享下你在用既程式/度既方法
      相信師兄就算唔係贏緊咩大錢,應該至少都係正數緊
      我真係希望正數返

      刪除
    3. 小弟依家都唔係求發達
      真心希望師兄當幫下我,指點下迷津
      或者我地可以交換個email詳談
      Ohnight8290@gmail.com

      刪除
    4. 池某平時買股票、賭馬、賭波所用的基本方法跟這個BLOG所提到的方法是完全一致的,沒有隱瞞。
      不過,在賭大彩池方面,確有一些繁瑣而有用的小技巧還沒有介紹。池某希望日後有時間可以整理整理,再寫篇文分享一下。

      刪除
    5. 小弟應該睇邊幾篇文學野
      另外師兄無用程式賭波/馬架?

      刪除
    6. 1.池某寫這個blog,用意是作為自己讀書、生活、思考的記錄,出發點是很個人的,並沒有考慮到其他人或讀者的興趣和需求,更沒刻意顧及讀者對文章的接受程度。這些文章並非教材,也不是課程notes,池某也不知道應該睇邊幾篇。

      2.池某的波馬股買賣都是由電腦決定的,不知道那算不算是你所說的「程式」。不過在池某看來那並非什麼神奇程式,只能算是一個防止自己頭腦發熱時行差踏錯的機制,其本質跟一些投資者以文字化表述的投資x誡之類沒有什麼分別。

      刪除
    7. 咁師兄可否分享該些程式,好希望師兄可以幫下小弟:(

      刪除
    8. 如果兄台真的認為這些程式有幫助,池某建議參考真正馬場大贏家的分享:

      https://www.youtube.com/watch?v=YOVrZrJ-wtc

      25'28"開始就是介紹「賭馬方程式」

      和程式相關的理論:

      http://www.ruthnbolton.com/Publications/Track.pdf

      刪除
    9. 不能直接分享程式嗎?
      助人為快樂之本啊,當做下功德都好

      刪除
    10. 兄台所指的是方法、理論還是公式?這些都已經公開了呀。
      如果兄台認為會存在一條一撳掣就告訴你買哪匹馬哪個球隊的程式,池某也希望有人能分享給我。
      在池某的認知之中,波馬股的投資應該是一個系統工程,投資者應該根據自己的資金水平和承受風險的程度,選取用得著的方法和理論組合適合自己的系統,並非用一條程式就可一勞永逸等收錢。
      諸如池某曾寫到的「賭波的最優化投注系統」、「賭馬的最優化投注系統」等等,並不是什麼神秘的贏錢程式,這些資源在網上都是公開的,誰都可以用:
      http://www.sportsbookreview.com/betting-tools/kelly-calculator/

      刪除
    11. 我當然有睇呢幾篇文章,但主要都係教點樣分配注碼
      但網主你可否提供啲增加命中既方法,例如點度馬,點睇足球盤
      小弟想請教既係呢啲

      刪除
    12. 噢,兄台問錯人啦。池某平時唔睇馬唔睇波,更加唔會度馬唔會睇盤。
      池某的命中率應該唔高,亦都冇諗過點樣增加命中率,平時都係買完就等運到,瞓醒覺先睇下A/C有冇多左錢。
      池某非常注重注碼分配是真的,而且認為做好注碼分配比其他一切都重要,亦係盈利的關鍵。舉一個簡化了的例子,假如賭波有一個彩池叫「半全膽」,你認為呢場結果會開1:0,你個袋只係剩返10蚊,(0:0,1:0)同(1:0,1:0)兩個選擇,你會買邊個?

      刪除
    13. 咁我應該會買0-0,1-0
      既然係咁,兄台可唔可以教下你上面post條link Kelly calcalation係點運作架
      因為我無相關知識,即係每一個空格應該輸入啲咩
      同埋結果係點用
      唔該網主

      刪除
    14. 池某一定係買1:0,1:0

      賭波揀Independent Events,隔離揀同時賭的場數
      賭馬揀Exclusive outcomes,隔離揀一場出賽馬的數目
      揀Decimal Odds,填入馬會開出的賠率
      揀Win Prob,填入自己計出的機會率
      結果係分配在每個球隊或馬匹的注碼比例

      刪除
    15. 重點就係呢到,究竟點計機會率......

      刪除
    16. 池某的「簡單易用的賭波公式」中有介紹到一些方法。不過,正如文中所說,用這些方法是贏不了馬會的,但作為引發思考的思路是很不錯的。池某也在多篇文章中強調Kelly criterion思維的重要性,但並不認為所有注項都需要準確無誤地細算出來。實際上,如果兄台能想明白為何買(1:0,1:0)比(0:0,1:0)優勝,已經比去鑽研這些所謂程式實用無數倍了。

      刪除
    17. 是因為前者賠率較高嗎??較值搏??
      定是因為開前者馬會會賺更多錢?
      但始終計算唔到機會率或提高命中
      一切理論都只是徒然

      刪除
    18. 理論上,兩者機會率是一樣的,但大多數人在實際操作中都會選擇買後者,故此買前者如果中了派彩會比你想像中多,買後者如果中了派彩會比合理的賠率少。
      從這個例子可以看到,並不需要計出機會率也不用理會命中率。別人的思維和操作誤區就提供了盈利空間。
      正因為很多人「以為」自己可以準確地計算到機會率或「以為」自己可以提高命中率,令很多彩池都有這樣的盈利空間。

      刪除
    19. 你好有心機回應 飯來將口的人.(可能包括我) 想講句謝謝

      刪除
    20. 不用客氣。
      透過與blog友的互動,自己也會從blog友們的疑問和體驗再次思考這些方法的優劣,以及可行和不可行之處,這對於自己進一步了解及改進這些方法也是很有幫助的。

      刪除
    21. 最近誤打誤撞,有幸閱讀池某的文章,獲益良多,非常感謝。
      以上的討論很有啟發性,尤其簡化「半全膽」的例子。想請教池某(1:0,1:0)比(0:0,1:0)優勝 的問題。
      如果要以上兩者的機會率一樣,是否要有以下assumptions?
      - P(1:0 (半場))*P[1:0 (全場)]|[1:0 (半場)]= P[0:0 (半場)]*P[1:0 (全場)] |[0:0 (半場)]

      刪除
    22. 歡迎到訪。
      理論上,如果我們不是根據往績計算,而只是用同一組「實力指數」去generate半全場波膽的比分,(1:0,1:0)和(0:0,1:0)兩者的機會率確是一樣的。
      請參閱這篇:
      http://poolshunter.blogspot.hk/2015/09/blog-post_13.html

      刪除
  2. 博主,可唔可以將每場數計好啲數據放出來,供大家參考下?

    回覆刪除
    回覆
    1. 請參考「投資如打仗 你能帶多少兵?」一文。

      刪除
  3. 發現了好BLOG,謝謝分享。
    雖然我唔識賭馬,但我對佢背後的計算方法好有興趣,記得以前有本書叫「計得精彩」,不過無緣買到。
    另外,之前上網找到一個網頁:
    http://home.pacific.net.hk/~phoebech/
    裡面有些分析程式,可惜沒有密碼,無法了解內容。

    回覆刪除
    回覆
    1. 「計得精彩」係一本好書,書中介紹了很多統計方法的應用,很具知識性。
      惟一缺點係書裡介紹整MLR模型的方法...照做的話是不可能成功的。

      刪除
    2. 很久以前曾下載過這書的電子版,但因為小弟不賭馬,沒有細看,要遲點才了解。

      上面提到的網頁,它介紹了不少分析工具,對我算是很好的入門。可惜這網已經荒廢了,我下載了當中的程式試用版,但沒有解壓密碼用不了。

      CHING,請問你是讀STAT嗎?看來你對這些統計工具和限制都很有有研究

      刪除
    3. 唔係major stat,而且已經荒廢多年,談不上有研究。

      刪除
    4. 唔係讀STAT就可能係精算嗰類,都係玩數據玩就好精嗰D科啦。
      多口問問,為何你會說:「書裡介紹整MLR模型的方法...照做的話是不可能成功」,可唔可以讀多少少?

      刪除
    5. 唔係STAT亦都唔係精算。
      MLR模型...因為池某照住本書的方法整左一次,睇唔到成功的可能。

      刪除
    6. 哈哈,實戰的確係最佳的驗証的方法,不過依本書已經很不錯,我諗香港只有一本咁既書,用統計學去分析。
      等我遲啲睇下本書,再向你討教,謝謝。

      刪除
    7. 書裡無關統計的部份也很實用,如大彩池部份。討教不敢當,觀迎討論。

      刪除
  4. 回覆
    1. 唔知點解自動去左「垃圾留言」

      刪除
    2. 可能之前去其他BLOG吹水內容太垃圾,被標籤為垃圾留言產生器掛....

      刪除
  5. 池兄, 可唔可以透露兩三個電腦程式揀馬嘅參數?

    回覆刪除
    回覆
    1. 池某的model好大路,基本上都係騎師、練馬師、檔位、負磅、馬匹體重、體重變化、路程變化、近績等等大家都能想到的參數。

      刪除
  6. 池兄你好, 假設在入球大細盤中, 計算其中一方出現的機會率是56.25%, 請問要怎樣投注才可獲利? 謝謝!

    回覆刪除
    回覆
    1. 賠率要高過機會率先有+EV

      刪除
    2. 例如你個例子, 賠率要高過 1/0.5625=1.78, 投注先有+EV

      刪除
    3. 謝謝你的回覆

      先作出假設,
      然後定出篩選條件,
      統計過去5年數據,
      共出現3325場,
      勝率是56.25%
      馬會平均賠率居然有1.92
      現在仍要反覆計算及驗證中
      希望沒有計錯數

      下一步是策劃投注策略
      但這是最關鍵的

      刪除
    4. 神兄答得太好了,池某也想不到更好的答案了。
      賭波的注碼分配可以參考這篇:
      http://poolshunter.blogspot.hk/2015/09/blog-post_20.html

      刪除
  7. 池兄你好: 可否教小弟用下凱利計算機 分配注碼比例?
    小弟愚鈍 嘗試幾次都唔成功

    賭馬揀Exclusive outcomes,隔離揀一場出賽馬的數目
    揀Decimal Odds,填入馬會開出的賠率
    揀Win Prob,填入自己計出的機會率
    結果係分配在每個球隊或馬匹的注碼比例

    回覆刪除
    回覆
    1. 揀Exclusive outcomes,右邊揀一場出賽馬的數目,14匹馬跑就揀14。
      揀Decimal Odds,右邊填入馬會開出的賠率。14匹馬跑就要14行揀晒Decimal Odds,右邊填14個賠率。
      揀Win Prob,填入自己計出的機會率,注意14行百分比的總和要係100%。
      按「Calculate K」
      下面顯示的「Single bet stakes」就是分配於每匹馬的注碼百分比,用這個百分比乘本金的總額,就是投注於各匹馬的注碼。

      刪除
  8. 我想請教一下, 師兄你貼出來的數據參考為什麼"期望值" 總和不是100%?
    另外我想問當你有注碼分配數據後, 你會如何下注?.例如獨贏, 連贏位置Q?

    回覆刪除
    回覆
    1. 在這裡貼出來的是expected odds,將其取倒數再加起來應該是1左右,有馬退出那場其實也有一個整體的修正,只是沒顯示在貼出來的部份。
      下注部份,貼出來的兩場是10000元本金在1個Kelly下分配於每匹馬買獨贏的注碼。

      刪除
    2. 買連贏位置Q比獨贏複雜, 因為以池兄的例子而言, 數字只是顯示獨贏的期望值。如果要仔細計算, 就要同時計算跑第二/三名的期望值, 不過要計算的話程序就會非常多。

      刪除
    3. 是的。連贏位置Q要複雜一些,不過也不算太難,如果你的model可以算出跑第一的expected value,當然也能算出跑第二和第三的expected value。
      但要注意的是分配注碼的program,要由14項加到91項。

      刪除
  9. 13,14 號expected odds是99999.為什麼賠率會係1?
    因為你覺得跑出既機會接近0, 所以賠率都廢事打? 另到其建議投注參數<1?

    回覆刪除
    回覆
    1. 你諗多左,
      只係果場馬冇13, 14號,所以冇expected odds同賠率

      刪除
    2. 快活谷賽事只有12匹碼,和退出馬匹一樣,沒上陣的馬沒機會贏,故要輸入一個盡量大的expected odds。
      投注了退出馬匹馬會會退飛,賠率當然是1。

      刪除
  10. 我仲有想請教一下期望值參數問題.
    我知道每個人都有自己一個方法去評估馬匹勝出率, 假設只有3個因素(如:磅位, 檔位, 入Q次數) 那麼如何把這3個因素綜合為一個"期望值".

    回覆刪除
    回覆
    1. 不要說3個因素了,就算只得1個因素,也不是一篇文章的篇幅就能完全說清楚。
      如果是以學習統計知識的應用為目的,建議參考「計得精彩」一書所介紹的正態分佈法。
      如果要在馬場博殺,參透本文介紹的Ruth N Bolton和Randall G Chapman的論文只是基本,仍遠遠不夠。
      馬場的贏家肯定不會是拿份馬經在茶餐廳裡頭顎顎望住個電視的人,是有知識門檻的。

      刪除
  11. 池兄 小弟照你甘做 但 「Single bet stakes」顯示的只有 3隻有數
    其他都是 0.0000% 是否又唔岩?

    回覆刪除
    回覆
    1. 顯示0.0000%是對的,即是這些馬不用下注。

      刪除
  12. 明白!多謝池兄 無私 分享 教授!

    回覆刪除
  13. 版主你好

    本人已輸到仆街再仆街了!

    有冇可以簡化以中文版片介紹方程式給我呢?

    非常感謝感恩


    回覆刪除
    回覆
    1. 「計得精彩」書裡所介紹的方法是池某見過最簡化的中文版了,當然那只適合作為知識的學習和探討,要製作成搏殺工具還是需要提升層次及加深自己功力的。
      需要澄清的是,所謂「賭馬方程式」並非一條x+y=z之類就能算出哪匹是頭馬的公式,而且一個很複雜的系統工程,要分多個模塊去解決不同階段的問題,而結果可能只是爭取到很微弱的一點優勢,甚至未必有優勢,故此不能過度信賴。最重要的還是要控制好注碼。

      刪除
  14. 你好,我想同你合作,正所謂一人計短二人計長,你本身有團體的嗎(賽馬)@_@?

    回覆刪除
  15. 池兄,很高興能認識你,我只識賽馬,只會做一些賽後的分析(不是馬會果D得幾隻字),賽後分析加入你的程式中,增加積分,增加命中率,希望對大家都有幫助,因為我只識做賽後xd,你有微信OR LINE嗎,我可提供賽後分析同未來跟進馬^^

    回覆刪除
    回覆
    1. 池某對由朝到晚傳播無思想廢話的wechat和line極度討厭,刪之而後快。「簡介」裡有池某的聯繫方式。

      刪除
  16. 你好,一起交流賽馬心得good,認識有心研究寶馬的請加我,chanchiwai32@gmail.com

    回覆刪除
  17. 哈哈,OK,明天留言給你,謝謝你的分享,但我還是不懂用,我明天計好一場馬再留言發給你陪率,你的注碼分配我很有興趣,感謝。

    回覆刪除
    回覆
    1. 歡迎。
      Expected odds的計算才是核心,注碼分配只是根據Kelly criterion,沒什麼特別,也沒什麼秘密。

      刪除
  18. 池兄!我要問 揀Win Prob,填入自己計出的機會率,注意14行百分比的總和要係100%。
    那麼「填入自己計出的機會率,」這裡自己是怎樣計的?不太明白!

    回覆刪除
    回覆
    1. 這部份就要各師各法了,有人用MLR model,也有人有自己的獨門刨馬估值心法。

      刪除

  19. 池兄:
    請問你以上的期望值如何計算出來。

    回覆刪除
  20. 池兄你好,
    我有看過計得精彩,但從沒有試過跟書建MLR。請問你的數據是從馬會網站直接下載還是外購的?計得精彩中的MLR有什麼問題?另外請問有沒有一些書或網站推薦閱讀?

    回覆刪除
  21. 你好,
    池某的數據主要來自馬會網站,也有很少量自己update的部份。
    計得精彩中的MLR問題在這裡的留言中回答過了:
    http://poolshunter.blogspot.hk/2016/03/gun-pit.html
    如果兄台是這個blog的常客,應知道池某平時多是看歷史書。

    回覆刪除
    回覆
    1. 不好意思今天誤打誤撞進了這blog沒有完全讀完每一篇文章。
      我誤會了計得精彩內的MLR有錯,我其實也知道計得精彩內選擇的Variable不足以令MLR得出一個比較準確的Fair Value。
      池兄請教你的MLR有多少Variable?

      刪除
    2. 噢,歡迎到訪。
      池某的MLR只有幾十個Variables,唔算特別勁。

      刪除
  22. 多謝你的回應。
    再多問一下你有否如BillBenter般用1000場賽事及這些賽事參與者的所有往績來建MLR?

    回覆刪除
    回覆
    1. 池某的MLR所用的往績超過1000場賽事。

      刪除
    2. 多謝你的回應。
      我剛剛看了你其他的文章,十分佩服你的知識。你覺得賭馬會否可以像買股票一樣一看便知市場估值錯誤-如巴老所說般不用計算便知道這是miss priced?

      刪除
    3. 多謝捧場。
      池某認為賭馬與價值投資的概念是很相似的,都是一個找edge的遊戲。但池某自問沒有一看就能找出錯價的能力,事實上其他投注者也不傻,不太可能留下非常明顯的空間。

      刪除
    4. 1000場賽事用於建立MLR是遠遠不足(1000場只是一季賽事多一點)
      沒有記錯池兄的馬匹賽事紀錄最少10萬條, 應該最少有10季賽事

      刪除
    5. 以下是從Bill Benter 文章中取出,所以一定超過1000

      In the author's experience the minimum amount of data needed for adequate model development
      and testing samples is in the range of 500 to lo00 races. More is helpful, but out-of-sample predictive accuracy does not seem to improve dramatically with development samples greater than 1000 races.
      Remember that data for one race means full past data on all of the runners in that race.

      刪除
    6. 回神兄,池某的數據冇咁多,其實也不需要咁多。MLR的效果不見是數據越多越好,例如韋達前幾季的勝出率一直在17%以上,近兩季只在12%左右,用太多舊數據反而會失真。

      刪除
    7. 回匿名兄,數據太少是做不到MLR的,特別是Variable有一定數量時,數據太少會令Parameter的估算值大起大落,很不穩定。

      刪除
    8. 如果池兄用time weighted的話可以有修正的作用

      刪除
    9. 這倒是一個解決方法。但事實上也沒必要用太多舊數據,池某現在更新一次data部電腦要run起碼40分鐘,數據太多部機頂唔順。

      刪除
    10. 建議池兄購買雲端服務如Amazon Web Services及Google Cloud Platform, 一個月二三百元但效能甚佳, 小弟有時候都會掟data上雲端處理然後熄電腦休息

      刪除
    11. 有咁正o既服務?池某真係大鄉里也。

      刪除
    12. 池兄可以用下面的link看看收費

      https://cloud.google.com/products/calculator/

      Google會提供數百美金的試用額, 有效期兩個月

      刪除
    13. 池兄會考慮田草定谷草嗎?

      刪除
    14. 數據庫的場數是包括了所有的賽事,在提取Variable時則會考慮場地和跑道。

      刪除
    15. 池兄用馬會還是馬網的資料?
      攞Data好麻煩,要寫一大輪。

      刪除
    16. 回 michael 兄,

      所以好多程式最值錢係數據, 唔係程式本身

      刪除
    17. 寫program非池某強項,所以唯有將勤補絀。
      池某會在每個賽日後update一個包括所有馬匹賽績資料的database。
      新的排位表出來後,只需從馬會排位表提取騎師、負磅、檔位等即場數據,再從database勾出馬匹賽績資料,就有完整的數據可用了。

      刪除
    18. 小弟最後都係落手寫,測試中。

      刪除
    19. 剛剛發現"沿途走位"有好幾個,再改一下。講起又講,計得精彩書中不考慮馬匹的MLR感覺總係好怪。

      刪除
    20. 對真正的馬迷來說MLR太悶了,把有血有肉的馬匹變成冷冰冰的數字。MLR只適合池某這種賭馬唔睇馬的「偽馬迷」。

      刪除
    21. 池兄每場馬都run一次regression?

      刪除
    22. 不可能啦,只能做到每個賽日run一次。

      刪除
    23. run多一次可能已經跑完兩三場馬

      刪除
    24. 正是。而且,正常來說一個穩定model的參數不會因多了幾場或少了幾場就有太大變化。

      刪除
    25. 原來剛剛設定錯了。難怪無結果。

      刪除
    26. 謝謝池兄指點。試驗過,大概可以,但有一兩場效果不太好。

      刪除
    27. 搞幾日就有效果咁犀利?池某之前搞左成年都不見成效。

      刪除
    28. 可能是符碌的,應該係唔太可行的。不過data 是ordinal,所以我不用MLR。電腦唔夠RAM,run唔到太多data。

      刪除
    29. 呵呵。以成敗論英雄,符碌成功也是一種本事。

      刪除
    30. 池兄用咩program fit model? R?

      刪除
    31. 哦,SAS 的確方便,不過我無。

      刪除
    32. 可以去大陸學術網站或高校網站download,舊版已經夠用。

      刪除
    33. 而家search sas既結果己經變哂洗腦歌

      刪除
  23. 雖然我唔識program啲嘢,但係都支持你哋,本身中意賽馬那種速度感

    回覆刪除
    回覆
    1. 多謝支持。
      高速、緊湊、變化萬千的賽事的確很能刺激觀感。

      刪除
  24. 回覆
    1. 原來kelly都唔係大哂
      池兄果然有先見之明

      刪除
    2. 8連敗 蒸發了我的本金 也蒸發了我的靈魂
      難道公眾的預測比我更準?
      看來真的不能再為賭而賭了
      PS. 唔怕生壞命,最怕改錯名
      還是用一個似名字的名字便大家稱呼

      刪除
    3. 不用灰心啦。池某賭大彩池20連敗、30連敗很常見。

      刪除
    4. 大彩池中一次就咩都翻哂來
      可惜小弟玩連贏 唔知中幾多次先搞得掂
      話就話盡其在我...不過看見自己的彩票差一點點就能中x8次的感覺真的有點不是味兒...
      btw 小弟在下注方面有點突破 10秒鐘可以下30注上限的注項 看來可以開始研究更複雜的彩池,始於它們較少受綠啡格黨的影響

      刪除
    5. 連贏原來難度好高架。
      池某最近嘗試將MLR模型應用於連贏,搞左幾個星期,發現比想像中難搞。backtest效果好似幾好,真正上場就時得時唔得。

      刪除
    6. 瓶頸位係邊? 計第二個機會率?定係時間?

      刪除
    7. 如何組合出一個合理可靠的機會率。

      刪除
    8. 這個應該也是我在掙扎的問題
      小弟都是跟計得精彩果個方法做

      刪除
    9. normal distribution?池某對呢個方法有所保留。

      刪除
    10. 因為每隻果個sigma應該唔同?定係other reasons?

      刪除
    11. 或者咁講 我知normal distribution 有好多問題
      但佢勝在方便易計+準過harville/ benter's correction(假設係用書入面果個constant)

      刪除
    12. 實際上跑第一的機會率與跑第二的機會率之間並非那麼「平滑」的關係。

      刪除
    13. 簡化來講,假設個model簡化到只有今季騎師表現這個因素,那麼用莫雷拉跑第一的機會率應該算出他跑第二的機會率也差不多,其實上差很遠;用韋達計也會出現另一個極端。

      刪除
    14. 所以用normal distribution應該不及用MLR計多一次第二的機會率那麼貼近實際。

      刪除
    15. 大家都嘗試跨過這關!

      刪除
    16. michael兄有新的領悟?

      刪除
  25. 小弟仲以為掉返轉tim
    計得精彩都有解釋

    回覆刪除
    回覆
    1. 印象中計得精彩不太推崇MLR,而大量介紹了其他的統計學應用,知識性遠遠大於實用性。

      刪除
    2. 噢,池某反而不認為是作者有私心收起來。而且很欣賞其傳播知識的苦心,相信已正面影響了不少求學之人,一件功德之事也。

      刪除
    3. 對肯放心機去思考的 自然會得出你的結論
      但對小弟這種學而不思的態度後輸掉的 少不免有點怨言

      刪除
    4. Peter兄乃明理之人,相信是說笑而已。

      刪除
    5. 哈 看了十五年墨守成規的教科書 忽然有一本要不斷思考 加上工作壓力大 頓時不知所云

      刪除
    6. 呵呵。香港教育制度的失敗。

      刪除
  26. 敢問池兄及各位有無人有馬會的顏色卡?
    有點事情想請教你們

    回覆刪除
    回覆
    1. 印象中有收過邀請,冇理佢。池某唔睇波唔睇馬唔入場,用唔著。

      刪除
    2. 聽講有顏色卡可以用speedbet
      賠率更新都快d
      Btw 原來三重彩賠率根本睇唔到
      有d好奇職業集團點賭三重彩

      刪除
    3. 池某連連贏都未計掂,未得閒去八卦三重彩。

      刪除
    4. 看來池兄目標清晰,預祝成功

      刪除
    5. 其實今日尚算成功,但上星期三非常失敗且原因不明,看來還是漫漫長路。

      刪除
    6. 又唔可以咁講,上星期日都頗成功。

      刪除
  27. [池某的model好大路,基本上都係騎師、練馬師、檔位、負磅、馬匹體重、體重變化、路程變化、近績等等大家都能想到的參數。]

    池兄,
    依你過往經驗, 請問參數/系數越多,
    是否對對預期賠率(EO)的準確性有所提高, 呈正比作用呢?

    回覆刪除
    回覆
    1. 是的。「有效的」參數越多,期望賠率會越準。

      刪除
    2. Thanks,
      當有效參數越多, 係咪會令條CURVE相對更平滑? 中位數更高?
      還是相反?

      刪除
    3. 下?唔係Linear regression喎,點搵條CURVE?

      刪除
    4. SORRY, 我諗左另一樣野!

      理論上, 甘馬匹既EO越準確, 相互之間既差距會更大?
      相對RO既差距又會更大, 買既馬匹數量又會多左?

      刪除
    5. 唔一定的,其實RO都係一年比一年準。越來越難賭是真的。

      刪除
    6. 假設, 我揀馬既能力好強,
      當有14匹馬, 我可以直接篩走當中8隻,
      要用甚麼方式投注, 會相對更有利?

      刪除
    7. 最怕又係「啡綠格黨」..., 到時又係暈得一陣陣!

      雖然理論上, 縮窄範圍已經佔有優勢?

      刪除
  28. 池兄,

    一年比一年難賭既真正原因, 你已經自問自答了, 都係[ 華 山 一 條 路 ]!

    "MLR模型,正是直指核心的利器,一次過把全場所有上陣馬匹的取勝機會率算准,再以Kelly criterion進行最優化的注碼配置,“九陰真經”就是這樣練成的。
    現在值得觀察的是,未來的華山論劍越來越參與者均以“九陰真經”交手,結果會怎樣?如果大家模型中有效變量都差不多,理論上計算結果也會趨於一致。"

    回覆刪除
    回覆
    1. 正是這樣,一到開閘前就一同變了「啡綠格黨」,大家都冇肉食。

      刪除
    2. 隨時係自己變了豬,開拓其他更容易找到錯價的彩池才是正道。

      刪除
  29. 池兄,
    請問你是如何衡量一個 [好參數] ?

    是否再經統計確認嗎?
    到是因應甚麼情況下, 納入MLR模型?

    回覆刪除
    回覆
    1. 正是。參數夠不夠好,Chi-Square和Pr > ChiSq這些統計指標會有明確的結果,不必自己主觀去衡量的。

      刪除
  30. 我諗到一個stat model一定可以大大增加命中率,但係要寫有d煩,合作下?

    回覆刪除
    回覆
    1. 一般來說,stat model不會太煩,真正煩人的是data。
      若以MLR model來說,model本身是無法計算命中率的,能否盈利與命中率的增減並無太大關係。

      刪除
  31. 回覆
    1. 據聞顧教授正是用這種方法,在其1998年後發表的論文曾多次提及。池某奇怪的是,那Benter等人從80年代中到1998年這段時間又靠什麼贏錢?

      刪除
    2. 寫唔難,拿data煩。。。

      刪除
    3. 我們這些非專業賭徒其中一大劣勢就是data不完整。alan兄可以考慮下幫趁「投注樂」。

      刪除
    4. 所以資料供應商收得貴,但仍然好好生意係有原因

      刪除
    5. 有心人可以夾下錢一齊去馬呀

      刪除
    6. 一講錢就會有麻煩, 睇下顧教授個case就知道

      刪除
    7. 神兄所言是事實,而且未必每個人都認為適用。

      刪除
  32. 池兄您好,留名支持好文章!

    回覆刪除
  33. 多謝你發文,你讓我知道原來香港還有代表在練九陰真經的。對於獨立人仕,此舉是十分艱巨丶長路漫漫!

    祝 成功 達成目標!

    回覆刪除
    回覆
    1. 謝謝你。香港不但有修練的,還有早已練成的。

      刪除
  34. 有趣!練成的是個人 還是 團隊? 我有興趣知道有冇前人以個人之力殺出一條血路 :)

    回覆刪除
  35. 新聞有似冇交代他成功與否,或有多成功...還是一個迷吧

    回覆刪除
    回覆
    1. 很成功呢,過去三個賽季盈利5600萬元。

      刪除
    2. 係我孤陋寡聞了,請池有機會多多指教!

      刪除
    3. 呵呵。池某的微末功夫不成氣候啦。Blog界還有很多猛人:
      http://htmichael.blogspot.hk/
      http://peterpanfantasyland.blogspot.hk/

      刪除
  36. 原來顧教授單案仲有一樣野係報紙冇講過, 原來原告人搵Dr Ziemba做專家證人。池兄應該知道Dr Ziemba係何方神聖, 叫得郁Ziemba呢個原告都唔係小人物

    回覆刪除
    回覆
    1. Ziemba算是統計模型賭馬的理論鼻祖,顧的論文也常引Ziemba的作品,他做專家證人是最適合不過。

      刪除
  37. 首先自我介紹..我是一個老馬迷.由94年開始賭馬,頭3-4年是輸錢的,之後睇了"計得精彩"這本書.開始明白什麼是賭馬,由這時開始,成績進步了.之後連續6年都有錢贏.有時一年贏幾千, 有時一年贏幾萬. 但我的本金只是每個月300蚊.輸晒就等下個月贏到本即取回,贏幾千就羅部份出來. 用的方法都很簡單. 買抵買的馬罷, 其實賭馬贏小錢唔難, 一次過贏大錢就睇運, 想長期贏大錢呢? 我會講, 比心機工作好過.其實賭馬所用的時間精神能力付出大, 比大家專心工作所賺的少...之後明白這個道理..就戒左賭馬了..差不多十年...上年,有朋友欠我一點少錢問我攞馬會戶口還錢, 他不知我戒左賭馬. 但因為他那700蚊, 我又開始賭馬了. 上年都算幸運...有幾千利潤吧. 今年就成績差少少..剛剛幾個賽日輸掉了所有利潤..算是打個和吧.希望今季保持到不敗啦.

    其實.本人想講MLR模型其實已經失效多時. 或者咁講, 他們可能已經脫離這個模式, 進入另一個賭馬方式. 為什麼我會這樣說呢? 這模式是賭機會率賠率差.利潤的空間少.正如版主所本篇的道理一樣...41倍可以是好抵買, 27倍就未必抵買了. 那個時候, 你已經變了負值. 因為波幅高達30-40%, 8倍變4倍都夠膽死.

    另一個問題是..假使命中率與回報率不變, 當33.33%命中100%總回報. 一場買1隻馬, 連輸9場你還敢買第十場隻20倍嗎? 這是心理問題. 如果是一場賭多隻..那就更難贏了.為什麼? 你要夠膽刪1隻5-6倍左右既馬再平均買先至打和, 再刪多一隻才可以有20%之利潤空間..從省1萬字...

    賽馬是一個多維模糊思考型比較活動,現在可量化的數字比較性不多, 要用科學方法.頂多量化到馬的實力, (騎師,鍊馬師)心理取態呢?如何量化? 比賽形勢及反形勢呢? 倍率? 注碼? 很多都不能用數未準確表達. 這個是多維度模糊思考...人腦會比電腦好..

    回覆刪除
    回覆
    1. 謝河馬兄經驗之談。
      賭機會率賠率差的模式應是kelly criterion吧,MLR模型只是有關機率分佈計算的部份。

      刪除
    2. 我們說電腦賭馬,只是利用了電腦的計算速度和資料儲存量,並未有像AlphaGo那樣用到AI,故此無論用什麼模型、什麼program,實際上都是人腦賭馬。不知河馬兄同意否?

      刪除
    3. 我表達有問題.SORRY...我不是說kelly criterion. 這個是注碼運用方法.

      更正..本人想講MLR模型其實已經失效多時.==>
      本人想講你可以利用MLR模型去尋找機率, 但利用這個機率去賺賠率差已失效多時. (這樣表達會清楚D. 但都係差緊D野.請見諒語文能力唔好)

      刪除
  38. SORRY..見到留言有感而發..失言了.

    回覆刪除
    回覆
    1. 言重了。
      交流的本意就是大家一起提出問題、思考解決之道,共同進步。
      歡迎暢所欲言。

      刪除