2016年5月16日 星期一

名次的煩惱

記得多年前曾經看過一齣很感人的伊朗電影,名叫《小鞋子》。印象最深刻的一幕,是片中主角小男孩以“一定要跑第三名”的決心,參加一場競爭激烈的賽跑,在付出血與汗的代價後,與一眾對手幾乎平排衝線,結果是得了冠軍,因與自己一直奮鬥想得到的季軍獎品一雙波鞋擦肩而過,而在眾人的祝賀聲中黯然淚下。

感人故事的背後也反映了一個很現實的問題:對第三名的估算,並不比第一名容易,甚至是更難。實際上這個也正是賭馬時最常遇到,又不容易解決的超級難題。從早前法庭對顧鳴高教授一案的判詞來看,顧教授近年在馬場的巨額利潤,主要是從連贏和位置兩個彩池而來,這是一個強而有力的證據,說明了現時馬場的盈利空間,正是藏在對第二名和第三名機會率的估算。

現在馬迷們都有馬越來越難賭之嘆,原因是大家對頭馬的估算方法日趨高明,也算得越來越準,以致獨贏彩池有利可圖的“錯價”買少見少,將目光轉移到其他彩池是很自然的選擇。既然獨贏又已相當準確地反映了大眾所估算的頭馬機會率,最慳水慳力的做法,當然就是直接由頭馬的機會率推算出第二名和第三名的機會率,這樣就可以到連贏和位置彩池尋找“錯價”了。



池某剛開始賭馬時就聽馬迷前輩說過,衡量一場馬中A、B兩匹馬所構成的連贏是否“抵買”,有一條簡單的“公式”,就是將A、B兩匹馬的獨贏賠率相乘再打八折。池某不清楚這條“公式”的理據何在,想必是做了一些假設,且經“斷估”簡化而來:

要計算A、B兩匹馬所構成連贏的機會率,最直接的理解就是計算:A跑第一的機會率*B跑第二的機會率+B跑第一的機會率*A跑第二的機會率

假設一匹馬跑第一和第二的機會率一樣,而馬會獨贏彩池的抽水率為18%,“合理的”連贏賠率就變成:1/(0.82/A的獨贏賠率*0.82/ B的獨贏賠率*2)=0.744* A的獨贏賠率* B的獨贏賠率

故兩匹馬的獨贏賠率相乘再打八折其實是低估了這兩匹馬所構成的連贏機會率,很難按此找到“抵買”的“錯價”,不如打七四折“合埋”。但即使是打七四折,也是錯的,錯就錯在那個假設,一匹馬跑第一和第二的機會率,大多數情況下是不一樣的。

設想在一個很少馬匹上陣的場合,例如同場只得三、四匹馬角逐,不難理解,如果一匹馬很大機會跑第一,那麼牠跑第二的機會率就會小得多;相反,如果一匹馬跑第一的機會很微,那麼牠跑第二的機會率就會大得多。當然,如果同場角逐的馬匹多達十三、四匹,對比會沒那麼明顯,但道理是一樣的。

故此專業一點的賭徒都不會接受這個假設,也不會使用這樣簡單的公式。在外國討論賽馬的論壇中,以獨贏機會率推算位置機會率的問題,討論得最多的就是Harville formula。簡單來說,Harville formula是利用條件機率(conditional probability)的思維,把B馬跑第二的機會率,變成當A馬不在時B馬跑第一的機會率,A馬跑第一而同時B馬跑第二的機會率就變成:p(A)*p(B)/(1-p(A))

這個方法的好處是,用來找一匹馬跑第三的機會率也很方便,照推而已。但實際上這個方法不好用,其最大的問題是,當一場冷熱門賠率很懸殊,特別是有的馬是一面倒大熱門時,計算出來的結果會偏差很大。

《計得精彩》書裡提出了另一個由頭馬的機會率推算出第二名機會率的方法,就是正態分佈法。正態分佈法的好處是計算出來的機率分佈比較“合理”,不會出現同一匹馬有七成機會跑第一、八成機會跑第二這樣的極端矛盾,缺點是計算頗為複雜,若要計算第三名的機會率,真係難到嘔血。更大的缺點是,這個方法計算出來的機率分佈並不貼近實際。

舉個例子,如果與“翡翠紅星”同場還有一匹馬叫“翡翠黑星”,兩匹馬的獨贏賠率一樣,用正態分佈法計算出來兩駒搭各瓣連贏的賠率應該是一致的,但實際上這個結果是低估了“翡翠紅星”跑入Q的機會率,因為馬迷們都知道,“翡翠紅星”是一匹“二奶王”,其獨贏賠率並不能充分反映牠跑入Q的機會。故此正態分佈法在實際搏殺中甚至可能難敵普羅馬迷。

出現這樣結果的原因,是使用正態分佈法有兩個假設的前提,一是假設了所有馬匹的表現是服從正態分佈,二是假設了每匹馬表現的Variance是一致的。而現實顯然不是這樣的。

結論:以獨贏機會率推算位置機會率較適合理論研究,不宜用於落場搏殺,若要真金白銀投入厮殺,另闢蹊徑獨立地計算位置的機會率才是更可靠的選擇。

110 則留言:

  1. 我計算後馬匹跑第一的機會率高,第二的機會率都高,實戰就完全唔得。

    回覆刪除
    回覆
    1. 再簡單一點理解,如果一場馬只有兩匹馬上陣,一匹馬跑第一的機會率很高,那牠跑第二的機會率很低才對。當然馬多了理解起來有些複雜,但原理是一樣的。

      刪除
    2. 池兄有看過Chapman的另一篇文嗎?

      刪除
    3. Still Searching?
      池某Still Searching...

      刪除
    4. 池兄的電郵是profile 裡contact me 那個嗎?

      刪除
  2. 池兄,流星對此問題已有完美的解決方法,不知池兄有否興趣合作主攻位置彩池?可電郵詳談。

    回覆刪除
    回覆
    1. 完美解決係咪要solve一個14x14的matrix?諗下都覺得頭痕。

      刪除
    2. 如果計得準玩位置q仲正

      刪除
    3. 點止PQ,仲有單T、三重彩、孖T、三T...

      刪除
    4. 諗起都覺得興奮。。可惜小弟乜都唔識:(

      刪除
    5. 要完美解決,應該將每匹馬每個名次的機會率都計出來:
      A1 A2 A3 ...
      B1 B2 A3 ...
      C1 C2 C3 ...
      . . .
      . . .
      . . .
      而且,結果要符合每個row加埋係1,每個column加埋都係1。
      用normal distribution可以解決row的問題,但解決不了column。
      用regression可以解決column的問題,但解決不了row。
      此乃難點之所在也。

      刪除
    6. 不用14×14那麼複雜,位置只需要計到每匹馬進頭3名的機會率就可以了

      刪除
    7. 流星兄想指GLM?我估池兄現在每隻馬由1到14的機率加埋係1(我視之為Row sum),但column sum就唔等於1。用column嘅角度才知值唔值博(expectation >= 1),此乃難點之所在。

      刪除
    8. 各位師兄太利害了!沒來一陣子,大家在各方面都有很多得著。
      但我被新程式弄得頭昏腦脹,研究停滯不前呀.....

      刪除
    9. 低能一問,可否用Monte Carlo Simulation以冠軍的機率估計其他名次的機率?

      刪除
    10. 回Ivan,
      問題係跑第一的機率同跑其他名次的機率可能有不同, 用任何方法模擬都解決唔到

      刪除
    11. 流星的方法的確可做到column同row加埋都係等於1,只是實際操作時第四名至最尾一名的機會率無計算的必要罷了,因這會加重電腦的負擔。

      刪除
    12. 回各位,池某是解決了column sum。在操作上,row sum也沒什麼矛盾,因為獨贏沒有row sum的問題,位置也可以如流星兄所說將第四名之後省略不計就算。不過池某並不認為眼不見為乾淨就是把問題完全解決了(maths佬只相信可以被完整證明的定理,真係煩,哈哈。)

      刪除
    13. 可能真係要用顧教授的markov chain monte carlo method先搞得掂。

      刪除
    14. 的確有個theorem做呢件事,但得出嚟嗰個matrix 又可能面目全非。

      刪除
    15. 越難,代表盈利空間越大。賭博絕對係零和遊戲,個個都搞得掂即係冇人可以贏到錢。

      刪除
    16. 用excel 其實做到,但點解要咁做就諗唔明。

      刪除
    17. 係 做完出嚟係同normalize 頭馬後嘅機會率似,整體distribution over place 1 to 14都似,但係咪咁做就啱呢?

      刪除
    18. 至少用我計出嚟嗰堆probability 似

      刪除
    19. 池兄,流星的意思是這方法真要算的話可完全算出每隻馬獲得第1~14名的機率,並可以做到col sum及row sum都等於1。只是因運算速度問題在應用的時候大可省略第4名以後的部分。

      刪除
    20. 回michael兄:
      聽落唔覺有破綻。michael兄有否想到什麼疑點?

      刪除
    21. 回流星兄:
      池某明白流星兄的意思,也沒有懷疑流星兄的方法行唔通。
      只是因為池某自己的方法在操作上也是行得通的,但在理論上無法說服自己,令身為maths佬的池某對自己的方法不甚滿意。

      刪除
    22. 回池兄及流星兄:
      反而我唔明白流星兄的意思,哈哈。

      刪除
    23. 流星今天晚上做了點測試,結果發現位置彩池比獨贏彩池更難獲利 (即實際賠率鮮有高於預期賠率的情況),看來位置彩池也有不少高手在。

      刪除
    24. 池某現在對連贏抱較大期望,上星期三戰績甚佳,但星期六又唔係好得...

      刪除
    25. 我成日都搵唔到real odds > E(odds),可能要做啲filtering 再normalize.

      刪除
    26. 如果各個組合機會率加起來等於1,應該唔會搵唔到,冇理由咁準。

      刪除
    27. 我係懷疑緊我計出嚟嗰個連贏誤差大,哈哈

      刪除
    28. 化返col sum=1,可投注項應該是非此即彼的。

      刪除
    29. 我做了個1-4名的計算表. 結果出來的型態都彼跟現實接近.

      刪除
    30. 咁厲害!?用咩方法計算?

      刪除
    31. http://sshippos.blogspot.hk/

      給你參考.

      刪除
    32. 有什麼意見請指教啦...

      刪除
    33. 哈哈。是向河馬兄請教,豈敢指教。

      刪除
  3. 真的嗎?流星兄好利害,成功的話還有玩股票的必要嗎!?

    回覆刪除
    回覆
    1. 代流星兄答:
      股票同賭馬都可以做rebalancing,將波馬利潤泵入股票,個倉大得好快。

      刪除
    2. 哈哈是不是好像拓跋珪那樣有田有地,有打不完的子彈,就算在戰場裏有多幾個慕容垂也不怕吧

      刪除
    3. 邊有咁易,秦由商秧變法耕戰兼備到「財務自由」用咗百幾年,拓跋家耕戰並重也發展了三代才勉強自由。
      只有神棍才會坤人「話咁易發達」。

      刪除
    4. 如果成功的話,也只是多了一種有機會賺錢的途徑罷了,想要發達還有很長的路要走。

      刪除
    5. 還是那句:活到老,學到老,do到老。

      刪除
  4. 很有趣的數學問題! 看來我也想看看'計得精彩'一書呢. 我原本看了頭兩段時, 內心的想法也是: 要計算馬A跑第二的機會率, 應該是看conditional probability, given condition大概是'最大熱門的馬跑不到第一'.

    但池兄也解釋了, 現實上是行不通的. 原來賭馬有這麼多有趣學問!

    回覆刪除
    回覆
    1. 看來我的想法是太簡單了. 如果有很多馬的話, 根本就處理不到這個情況.

      刪除
    2. 呵呵。有趣的學問很多,沒趣的學問也很多,池某不懂的學問更多。

      刪除
  5. 池兄對賭博的看法偏重數字,QUANTITATIVE, 本人喜愛足球,有甚麼好的足球書推介呢?

    回覆刪除
    回覆
    1. 呢個問題考起池某,池某真係冇見過系統地介紹賭波的書。
      要呼籲下此道好者有冇好介紹先得。

      刪除
    2. 賭波的基本就係要估計入球數字, 用邊種方法估都係一種大學問。
      中文書全部都係教人睇盤, 同買百家樂睇路一樣, 唔睇都冇損失, 睇左當參考


      外國就機乎全部係以科學計算去估, 就等同買21點做counting, 例如好多統計學論文用不同方法去估, Poisson, Dixon and Coles...
      當然亦可以參考池兄的方法, 因為池兄用的方法係最基本要識的方法, 再複雜就要用程式去做(SPSS, R, MATLAB...)

      真係要睇就要搵外國論文睇

      刪除
    3. 講真, 賭得叻的都冇動機出書教你, 個個都識的話隨時連少少的edge都冇埋

      刪除
    4. 其實睇下外國的賭波公司多成咁仲可以生存,池某都唔係好相信有人能在這個遊戲長期保持有edge。

      刪除
    5. 或者真係有人可能咁成功, 而賭波公司依然生存, 原因就係失敗者提供的利潤足夠支付成功者的損失

      刪除
    6. 有呢種能力的堪稱神人也,莫非正是神兄?

      刪除
    7. 能夠打和已經算好, 能夠贏錢絕非我等平民啦

      香港賭波選擇(賽事/項目)少, edge又低, 除非有一個命中率非常高的程式, 否則響香港真係好難贏波錢

      刪除
    8. 池某呢個月算係有利可圖,若從年頭計起,都係接近白做。

      刪除
    9. 樂觀諗, 白做總比幫馬會出糧好

      刪除
    10. 哈哈,池某諗得更樂觀,或說更阿Q:當係啲錢存在馬會,未攞出來而已。

      刪除
  6. 哈哈, 英雄所見略同, 我也未有找到過好的. 疑似的倒有不少, 但全都沒有真材實料. 賭馬的我不太懂, 但是看看你的文章,也獲益良多.

    回覆刪除
    回覆
    1. 多謝捧場。池某都要諗諗有冇賭波題材可以寫寫了。

      刪除
  7. Sorry賭博嗰部分我真係唔太明,不懂comment~

    但同意俗世社會set的"名次", 往往會沖激我們的價值觀,亦會使人類漸漸放棄他們真正喜歡的東西...

    回覆刪除
    回覆
    1. 哈。不好意思,悶親Cherry小妹。
      呢排blog友們留言討論這個問題較多,一直斷斷續續、零零碎碎,所以歸納一下。

      刪除
  8. 點知14X14....每隻馬VARIANCE 不同已玩死.
    小弟唔賭, 搭句訕而已.

    回覆刪除
  9. 等有空我也研究一下,搞一個「賭馬投資/投機/賭博(點都好:P)基金」hedge下股市都好,我是愈來愈覺得投資、投機、賭博只是人們憑印象的慣性分類,對「不事生產」的投資者/投機者/賭徒來說本質上並無太大分別。

    回覆刪除
    回覆
    1. 我覺得如果用值搏率/回報率計算去買波/馬/股票等等就已經係投資, 聽貼士/盲估就係賭博

      刪除
    2. 賭博和投資最大的分別只是形象問題

      刪除
    3. 池某定義:長線有edge的是投資,難以重覆的edge是投機,一舖定生死的是賭博。

      刪除
    4. 用之前射箭的例子就是:射144箭可保持優勢就是投資,射3箭搏大霧是投機,1箭決勝負是賭博。

      刪除
    5. 同意说法。但那是控制在操纵人的手里。赌马别人当是赌,但自从2007年开始,我已经觉得唔系。
      追求的,有点像雾像花,也会遇上无尽挫折,给同龄人笑话也多不声数,但也不能轻易放弃。人生就是对自我的追求,最少我相信是这样。

      刪除
  10. 池兄,想請教一下現時獨贏彩池是否真的很難搵食了?即池兄計出來的賠率已與最終實際賠率(調整馬會抽水後)相差不遠?

    回覆刪除
    回覆
    1. 獨贏彩池難搵食係因為明明計到有edge,落完注之後就變了「啡綠格」,利潤大打扣。

      刪除
    2. 換句話說如果拿啡綠格後的最終賠率來比較,與池兄自己算出來的賠率相差不遠?

      刪除
    3. 大致接近。當然多新馬或外來馬的場合差別會大些。

      刪除
    4. 預測接近最終賠率當然係好事,但最終目標係預測到接近真實出現率。

      刪除
    5. 「預測接近最終賠率」相信對池兄來說絕不是好事 XD

      刪除
    6. 回Ed兄,那只能是理想,現在不比十幾二十年前了,要打敗真實賠率也不一件容易的事。

      刪除
    7. 回流星兄,正是如此,「錯價」不明顯,圖利不容易。

      刪除
  11. 假設, 最終目標係預測到接近真實賠率!

    請問池兄是以自己計算的EO值, 再經MULTI-KELLY計算後, 分配注碼嗎?

    回覆刪除
    回覆
    1. 池某是以自己計算的EO再經MULTI-KELLY分配注碼的。
      但接近真實賠率並非計算EO的目標,計算EO的目標應是找到最準確的機會率分佈,若計出來接近真實賠率實在是無奈。

      刪除
  12. 池兄既MLR模型已經相當成熟, EO值原意就等同機會率(回報率/真實最終賠率)!

    回覆刪除
    回覆
    1. 匿名君的「真實最終賠率」是指馬會的real odds嗎?real odds只是大眾估算的機會率,並不等同真實機會率,若計算出來的expected odds與real odds接近,是無法盈利的。
      另,池某的MLR參數不是很多,不算太勁,也算不上成熟。

      刪除
  13. 池兄真係謙虛又客氣.

    EO接近REAL ODDS (馬會) 點會無法盈利?
    估計最終, 只是錯價空間相對較細,
    因有MULTI-KELLY計算, 就會作出最佳注碼分配?
    功能上, 又保本又保盈利, 不是嗎?

    回覆刪除
    回覆
    1. 若EO與RO太接近,因馬會會抽水,就會發生全線EO > RO的情況,Kelly公式計算的投注比例就會變成0,即盈利空間沒有了。
      我們說「錯價」,是希望其他投注人亂買,令RO大幅偏離實際的機會率,再以相對較準確的EO計算注碼,才有機會贏錢。
      所以最理想的情況是EO與RO各走極端,而RO又遠遠偏離實際的機會率。

      刪除
  14. 早晨, 池兄. RO是除稅及馬會佣金後既派彩比例值, 用MK計算後實有利可圖. 本人認為最後階段, 入閘前落飛既緣格或啡格, 絕非亂石投林! 池兄只不過是快人一步了!

    回覆刪除
    回覆
    1. 賭馬是易中難贏,啡綠格令最終回報低於預期,中得太多啡綠格會得不嘗失。

      刪除
    2. 此事, 當然明白! 坦白講, 經常揀中也不是一件容易事!

      但池兄計算既EO接近最終的RO, 結果只會是(得多於失)!
      高手!

      刪除
    3. 用MLR + MULTI KELLY,一場馬下注13匹也是可能的,所以要中一點都不難,但得不嘗失是很常見的。

      刪除
    4. 奇怪?

      如果揀出13匹, 甘馬匹既EO值非常接近? 還是相反呢?

      池兄, 點解唔只揀某幾匹投注呢? 現時極少開出EO/RO高既賠率?
      例如15倍以上, 己慳返極多本錢!

      刪除
    5. 一場下注13匹是指用MULTI KELLY理論上會出現這樣的可能,實際上池某也沒遇到過。一場買7、8匹的情況則偶有出現,通常是RO有一只大熱門嚴重過熱時就有這種情況。
      一場馬下注多少匹,注碼分配比例多少,MULTI KELLY自會給出最優化的配置,比自己揀有效得多。當然,前提是EO計得夠準才有用。

      刪除
    6. 刪一隻2倍WIN已可以買13隻

      刪除