2017年11月21日 星期二

錯的代價

和大部份賭仔一樣,池某也是樂於贏錢,討厭輸錢的。不過在一種特別的情況下,池某並不介意輸點錢,且不希望在這種情況下贏錢。那就是在自己決策犯錯或失誤的時候。

要做成一件事是需要成本的,犯錯是難以避免的成本之一。如果錯誤的決策一開始就導致輸錢,那是值得慶幸的事,因為這是以最小的代價去發現及修正一個錯誤。相反,如果決策錯誤卻一開始就因為運氣而贏錢,問題就嚴重了,這會導致往後的時間都極難發現這個錯誤的存在,甚至積非成是,指是為非,混淆自己的判斷,以為錯的是對,對的是錯,最終要為這個錯誤付出極大的代價。


面對自己的錯誤,最容易的選擇當然是像大師們那樣視而不見、視若無睹,給自己一個無限補時,就能“證明"自己“永不犯錯"了。但賭馬沒有補時,連輸三幾個賽日,就不得不誠實面對,無從逃避。

上文談到暑假期間為model多加了20多個factor迎接新馬季,結果弄巧反拙,新馬季開鑼後接連輸錢。這確是有點意外,因為從所有的統計指標來看,這些factor都沒有任何問題。

惟有翻資料找原因,後來終於找到,原來單看統計指標是不夠的,p-value小於0.05的parameter,並非一定有實際意義。所選取的factor,只要能反映出取值範圍的變化趨勢,統計指標就會顯示其具有統計意義,而不會理會取值範圍的符合程度。也就是說,這樣的factor可能是對實際毫無影響的,其存在甚至可能還會毒害與其相關性高而有正面影響的factor。不過,始終找不到判別這類factor的簡單方法,只能慢慢摸索了。

比較確定的是,這樣的“有毒"factor,較容易出現在相關性高的factor之中,故此,第一步需要做的,是“減肥排毒",大幅砍掉重複使用的參數,一下子就刪了20幾個factor,變到model的factor數量比“抖暑"前還少,結果是──時輸時贏,輸多贏少。

128 則留言:

  1. 池兄一次大贏,已可KO幾次細輸。波馬膽同玩股票一樣,最重要看年度總回報呢~

    回覆刪除
  2. 池兄何不還原基本步,新舊model同時運作,相比之下,或許能知兩者的優劣。

    回覆刪除
    回覆
    1. 因為新model有晨操同試閘,未到絕路都要頂硬上,不想回到過去。

      刪除
    2. 我係google search有關賽馬統計方法而搵到池兄嘅blog,池兄個blog真係令我大開眼界。

      近日見到池兄話加入晨操同試閘入model。我覺得如果單單將晨操同試閘數據化之後加入池兄嘅model會好易俾啲練馬師玩死!

      晨操同試閘嘅數據唔直接反映馬匹真正狀態。有練馬師鐘意係試閘收埋唔俾人睇,晨操可以係因為騎馬人而令到操練質素有分別。由riding boy騎、副練騎、大師傅騎、牌仔騎甚至練馬師自己操(例如告達理)已經可以有好大分別。

      如果將咁多唔準確嘅數據加入model,我覺得會搞亂成個model。請問池兄個model點去offset咁多人為問題呢?

      就算真正落場跑都可以為減分遊馬河,咁晨操同試閘就只會有更多不明因素。

      刪除
    3. 多謝捧場。
      是的,晨操同試閘從數字不能直接反映馬匹真正狀態和實力,今季第一場「同得福」與「永旺喜喜」就是明顯的例子。
      說到人為問題,又豈止晨操同試閘?
      統計學的統計,與講馬佬那種data mining式的「數據化」和計死數不是同一個概念,data有用或冇用會在大sample size下的分佈趨勢反映出來,有幾有用或害處有幾大,亦可從統計指標反映出來。
      目前做出來的結果是,晨操同試閘遠不如賽績那樣有效而無害,但也非完全無效。

      刪除
  3. 請問池兄
    如果用完成時間同標準時間比較, 假設A馬快於標準時間0.3秒就是-0.3
    B馬慢0.3秒 就是+0.3 , 記得池兄說過全部factor都會take log, 但log前必先要絕對值化負數, 來去離不開平方, 就算不是為了log, 而是為了加工來fit in model, 有時也少不免要平方開方之類.
    問題來了, 如是者做那種加工(去了負數), 那麼A馬跟B馬都是0.3, 變得完全沒分別, 纙緝上完全是錯的, 請問池兄會如何處理?

    回覆刪除
    回覆
    1. 以平方、開方、take log或加減乘除等方式處理data都是可以的。一般來說,要解決0或負數問題,最簡單的做法莫過於加個constant,但像完成時間這樣的factor可能要再花些心思,特別是想將名次、完成時間、勝負距離等高度相關的factor一同放入model時,如何做到各自有效又不dominated對方,是非常非常困難的,需要絞盡腦汁做更複雜的處理,且要耗費很多時間一次又一次地不斷測試。

      刪除
    2. 請問加個constant是應該如何做?

      刪除
  4. 我想池兄的意思大概是一律加個正數比佢等佢變成全部正數,例如-3 同 3可以加6比佢,等佢變成3 同 9。如此就會無論如何處理都是正數。

    如有錯請指正。

    回覆刪除
  5. 池兄,有沒有試過考慮 Principle component analysis?
    它可以讓你的 Data 轉化為 Orthogonal,它們的相關性應該可以大大減少。

    回覆刪除
    回覆
    1. 呃... 或者準確點說,應該是 Principle component analysis 可以讓有相關性的 Data 轉化為無相關性的 Transformed data。

      刪除
    2. 其實做其他transformation都得,之前加多了20幾個factor就是過度transformed的「成果」,雖然在統計意義上看起來有效,但有不少factor實際效果不彰。

      刪除
    3. 池兄之前是怎樣做 Transformation 的?

      以前我試過做 Regression,因為有些種類的 Data 有 Correlation,所以 Information matrix 很接近 Singular。其中偶爾會出現「Suppressor effect」,即是相關的 Data 會令對方的 |Beta| 很大,從而令 p-value 很小。

      以我所知,PCA 的作用是把這些 Data 轉化為 Linearly independent,確保 Information matrix 遠遠不是 Singular,從而降低上述情況的可能性,而不是為了提高顯著度或者有效程度。

      刪除
    4. 呃,不只是 Linearly independent,我記得還是任意兩行也是 Orthogonal。

      因為是 Orthogonal,所以任意兩行 Transformed data 完全沒可能有任何 Correlations。這樣的話就不會出現 Data 因為 Correlation 而令它們的 Beta 互相傷害。

      刪除
    5. 原則上,做regression的data應是保留越raw越好,最好是無論舊data還是新加入的data都能保持相同的樣子,只會在遇到阻礙逼不得已的時候才會做一些簡單的transformation。
      令data沒有correlations雖然可以使統計指標看起來很靚,但這只是對過去database的「解釋」,解釋過去不是我們砌model的目的,我們要做的是如何控制新的data,或說未發生的事,都落在這個「解釋範圍」,亦即我們不是要一個統計有效的結果,而是要實際有效的結果。

      刪除
    6. 我有想過這樣做,但往後的"factors"會更多,頭幾支PC都係linear combination of factors。

      刪除
    7. 做data transformation的過程離不開按某個「規律」(或說乘一個coefficient matrix)將data的數值縮或放而保留其information,要注意的是,當其中的data不斷加減變化更新時,這個「規律」是否可以一直維持不變?若答案為否,對下一場就談不上有預測功能了。

      刪除
    8. 大概了解池兄的觀點了。

      比方說,「全球總人口」、「全球平均溫度」、「全球海盜人數」三者的確有 correlation,然後透過適當 transformation 後,它們的確可以有 linear relations。

      但因為 correlation 不保證 causation,所以以「全球總人口」和「全球平均溫度」預測「全球海盜人數」遲早會出事。

      池兄的建議是應該找出有 causation 的 parameters,我的理解對嗎?

      刪除
    9. 對的,找factor時應考慮causation。比如馬匹的體重變化,在一些因果關係很強的條件下可以做出效果,即使不加任何條件,或在其他無厘頭條件下,只要做一些簡單的transformation,亦能做出具統計意義的效果,但這個結果未必有實際意義。簡單地說,一匹馬的體重輕了或重了一兩磅,是影響輸贏的「因」嗎?其實馬匹在賽前兩日內食多幾啖或屙多幾舊已經可以把「因」扭轉了(我們通常是用排位體重)。

      刪除
  6. 我也最怕就是:因為一個好結果, 便自以為決定正確.

    但我發現原來好多人都唔明呢個道理, 特別係投資界既人.

    回覆刪除
    回覆
    1. 但是相同的道理,在相反的情況下,會不會也因為起步時的少數不幸,導致錯過有效的預測方法呢?

      快餐人上

      刪除
    2. //好多人都唔明呢個道理
      因為投資可以補時,一日唔吹雞完場,都可以話冇錯。

      刪除
    3. //起步時的少數不幸
      如果方法正確而連續地輸,確是很不幸。

      刪除
    4. 有感而發而已,卻不知自身屬於前者還是後者。

      事源在下近日終於落場試玩孖膽,在先前試行一段時間的六個略有不同的模式中,選出一個每月皆領先(一、二位)的使用。結果一個月下來,竟然剛好出現該模式獲利掉到第四的情況。

      跟前段時間累積獲利近四萬的情況有明顯落差,雖然仍獲利千元,不過$1000在孖膽遊戲的波幅中似乎不值一提。即使未至於出現憂慮,可是看到這話題,聯想到自身近況,在下不禁有感而發。

      快餐人上

      刪除
    5. 好現象,有懷疑才會思考。XD
      孖膽的情況,計錯數的機會還是較微的,反而要考慮一下當越來越多的投注人由亂投注轉為有策略地投注時,自己的計法是否有足夠大的優勢差距維持盈利。

      刪除
    6. 最後一星期執番個尾彩,十一月結算獲利五千,總算符合試行階段的預測。

      不過在下仍然在人手投注,別說半自動系統,光是組合注項方面已經茫無頭緒。比如0:0#0:0、0:0#1:0、1:0#1:0、0:0#0:1、0:1#0:1可以五合一為1:0/0:0/0:1#1:0/0:0/0:1,就不知要如何讓試算表能自動組合,要思考的地方還多着呢……

      快餐人上

      刪除
    7. 多幾千元零用錢不錯嘛。早年曾試過一個月贏4萬幾,現在一個月贏4千都很不容易。

      刪除
    8. 試下將問題簡化, 將要買的注項排順序, 排完再諗下用咩方法組合埋一齊 (其實來來去去得幾招) ... 沿住呢個思路你自然會諗住解決方法。唔好諗到太複雜, 我最後個方案都係盡量減到少過 20 條飛, 咁一次就搞掂! 偶爾多過 20 條就分 2 次 ! 成個過程幾好玩既 !
      IT人

      刪除
    9. 相差十倍……

      組合注項感覺有點像趣味邏輯題,如果不強求最優解,的確簡單很多。

      快餐人上

      刪除
  7. //因為投資可以補時,一日唔吹雞完場,都可以話冇錯。
    呢個就係好多人炒股輸身家的原因,成日以為未平倉就唔算輸,實際是自欺欺人的自我安慰!

    回覆刪除
    回覆
    1. 所以說越遲糾正錯誤,最終的代價越大。

      刪除
  8. 池兄介不介意分享一下, 一點模型裡失敗的晨操factors, 等有心人不用浪費時間去做?
    如想保密不公開也是尊重你的
    謝謝

    回覆刪除
    回覆
    1. 晨操factors唔算太失敗喎,一般本來沒有而新加的都衰極有譜,容易出問題的是本來已經有又重複再做的。

      刪除
    2. 再請教一個問題
      晨操是用直接時間還是用次數比較好呢?

      刪除
    3. 池某都想知邊樣好。池某是用次數,只算是有些效果,談不上「好」。

      刪除
    4. 謝池兄
      我有想過用時間, 但問題是有些馬操1圈有些又2圈, 搞不懂如何才準確

      刪除
    5. 咁你應該要清楚晨操既意義先,點解要晨操,練馬師想得到d 乜,騎師想得到d 乜,你又想得到d 乜

      刪除
    6. 見笑了
      對晨操真的不太了解, 願聞其詳

      刪除
    7. 池某一開始就沒打算用時間,馬匹晨操時都不會用全力,時間是否有指標作用很值得懷疑。用次數也有其缺點,並反映不出一匹馬好或唔好,最多只能說明一匹操唔操得。

      刪除
    8. 以前YouTube 柏文台 有洪維德 用騎師角度講分析 ,或者對你有幫助

      池兄有傳統高手幫助,點解唔問下晨操時間既作用呢?

      刪除
    9. 上文提到的高手都話晨操時間的意義不是很大,特別是長途馬。

      刪除
    10. 假設二隻馬同操二段,一隻輕鬆跑48秒
      ,另一隻力騎跑47秒。如果你沒睇晨操片段,你是否認為第一隻馬比等二隻好呢

      刪除
    11. 感謝2位慷慨指點

      刪除
    12. 假設 練馬師指示係第一隻係跑50秒,第二隻指示係跑47秒, 我個人就會認為第二隻好過第一隻

      刪除
    13. //二隻馬同操二段
      都要兩隻馬同場作賽才有比較的意義,如果一隻跑長途一隻跑短呢?或者一隻跑一班一隻跑五班呢?

      刪除
    14. 還記得《計得精彩》裡面做過統計,那個晨操狀態三隻手指的指標當年是沒有大統計作用的。有冇師兄做過統計近年有沒有改變?

      刪除
    15. 池某在1 step model只會用客觀的data,不採用任何人為的主觀的判斷。

      刪除
  9. "假設 練馬師指示係第一隻係跑50秒,第二隻指示係跑47秒, 我個人就會認為第二隻好過第一隻" 可是如何得知"練馬師指示"才是難度所在
    另試閘後也有評語, 如何把評語變成數字也是大難題

    回覆刪除
    回覆
    1. 是的,實在很難。池某也嘗試過把賽後報告那堆文字做出一個factor,不成功。

      刪除
  10. 晨操或試閘時間對睇馬的人一定很有用。

    回覆刪除
    回覆
    1. 這是肯定的,問題是很難量化並應用作橫向比較。

      刪除
  11. 插口一問池兄
    踱步和游水其實算不算有效factors?

    回覆刪除
    回覆
    1. 不清楚呢,可能是有效factor,只是池某未能做出來。

      刪除
  12. 池兄, 可唔可以分享你係如何匯入xml的willpay? excel公式係咩? 我匯入佢永遠剩係已經rounding既賠率, 同以前aspx冇分別, 冇準確到兩個小數點嗰個

    回覆刪除
    回覆
    1. 比如Win,有一個column係/RACE/OUT,呢個係平時睇到的賠率
      79
      5.3
      27
      18
      24
      24
      1.9
      10
      76
      38
      106
      14
      12
      30

      另外,最後仲有一個column係/RACE/OUT/@WILLPAY
      79800
      5350
      27500
      18650
      24250
      24950
      1950
      10200
      76250
      38750
      106200
      14300
      12450
      30550
      將呢組數值除以1000就係準確到小數點後兩位的賠率。

      刪除
    2. 撘單問那裡可以查看 過往 準確到小數點後兩位的賠率
      xml貌似只有賽馬日的資料
      感謝

      刪除
    3. 過去的應該搵唔返了。可以試下自己計,蘋果馬網的賽果有每隻馬的獨贏票數。

      刪除
  13. 有禮81倍... 不得了。池兄應該呢隻執唔少...

    回覆刪除
    回覆
    1. 有禮唔中,白鷺飛翔就中,難得冇着格,幾和味。

      刪除
    2. 超熱門勝出,請問池兄有正回報嗎?

      刪除
    3. 有。相對於投入成本,回報率尚算OK。

      刪除
    4. 我大注中有禮, 但白鷺飛翔就唔中, 之後幾場都開大熱都唔中.

      刪除
    5. steven兄是用您上回提到的初盤賠率當EO的方法嗎?

      刪除
  14. 池兄請教下無啡綠格係咪意味住賭馬集團計唔到果隻馬?

    回覆刪除
    回覆
    1. 未必。可能只係edge冇咁大,唔代表贏唔到錢。

      刪除
  15. 想請教一下各位高人,你哋model入面有冇地度儀指數,如有可唔可以指點下點樣transform data放入model?

    回覆刪除
    回覆
    1. 呢個指數係賽前量度的,不太靠譜,特別係田草,經常跑跑下掛牌不斷變,而好快、好地、好黏所顯示的指數都是一樣。

      刪除
    2. 可唔可以透露池兄你model入面未經combine既factor有幾多個(例如路程、體重、距離上次出賽時間等等)?經combine後有50個,但係原先是有幾多個raw factor?

      刪除
    3. 池某經常說data越raw越好,但要注意,raw data並不等於raw factor,且factor未必是越raw越好,factor應是越能反映causation越好,所以即使是不會重覆使用的factor,池某也會盡量找合適的條件去combine,以凸顯其效果。

      刪除
  16. 用two step model 的兄台們, 大家alpha 同beta 的比例係幾多?

    回覆刪除
    回覆
    1. 原來呢個比例並唔係越大越容易贏錢。

      刪除
    2. 最容易贏錢時的比例係幾多?

      刪除
    3. Factor的數量和model的質素都會影響這個比例,並不存在一個很一致的最佳比例。不要試圖按一個特定的比例標準去打造model,那是本末倒置,若model的質素跟不上,會非常危險。

      刪除
  17. 池兄, 血腥排序有沒有聽過? Displacment都係一個嚴重影響預測的因素.

    回覆刪除
    回覆
    1. 冇聽過呀,願聞其詳。

      刪除
    2. 我是從一上演算法書籍到看到, 書中的章節是排序, 有一個是用打POKER做例子, 如果兩個對手, 實力是有差別, 自知弱的對手會盡量避免與強的對手比賽. 如果實力不相上下的賭局才會成事.

      賽馬也有這種情況出現, 只不過是很多是弱的對手或表面條件比較差的對手會縮...這樣會出現什麼情況呢?
      例如1-2-3-4-5隻馬, 5隻馬的排序都是按順序, 結果很可能是1-3-4-5-2 或1-4-5-2-3... 這個是常見的現見.
      因為如果全力之下得第二, 而頭兩名帶離345名很遠.
      結果是, 第二實力馬會大幅加分, 但又沒有頭馬獎金....

      再引申下去, DATA就會很容易將有優勢的排序條件變為沒有用.


      刪除
    3. 有些人賭馬或像我賭尾數場, 有時會大膽刪去一些實力馬. 原因是鍊馬師早幾場的機會馬表現都不太好. 所以估計尾數場都不會太著緊成績.這個都是血腥排序...
      本人不太喜歡它的中文翻譯. 這個理論是由生物行為學研究出來的. 本人比較覺得像賽局理論.

      刪除
    4. 有趣有趣。看起來有道理,要精確地用於實際應該還有不少難點要解決。

      刪除
  18. 11月29日 慘敗 無一場勝,輸6千

    回覆刪除
    回覆
    1. 11月29日收獲不俗,金錢炮同駿明珍寶都大注中。

      刪除
  19. 不太明白如何data要raw但是factor唔可以... 請問什麼區分data同factor? factor反映causation什麼意思?
    謝解答

    回覆刪除
    回覆
    1. 1.隻馬係乜顏色、馬尾有幾多條毛、行沙圈時屙左幾多舊屎等等都可以係data,但唔一定係factor。
      2.馬名有幾多筆劃都可以係data,而且在有限數據的database如果恰巧有分佈趨勢仲可能做到統計有效的factor,但這很可能只是randomness所致,與贏馬未必有因果關係。

      刪除
  20. 池兄,睇咗你嗰文章,小弟好佩服你好仔細同分析得好好。小弟有d嘢想池兄請教及俾意見,不能三言兩語喺呢度講曬,可否提供email或PM地址俾小弟嗎?

    馬克斯。

    回覆刪除
    回覆
    1. 簡介裡有池某的email。不過池某好少覆電郵,就算覆亦覆得好遲,郵箱近幾個月不斷被轟炸,應付不來。

      刪除
  21. 池兄,嘗試去睇簡介嗰郵件,最後冇反應,所以先喺度問池兄。
    1.小弟認識Excel係一般同埋冇programming嗰背景,所以想請教池兄是否值得去交學費學VBA?要用VBA嗰目的係想方便編程序去分析波。
    2.如果要去分析馬會波池,池兄有冇D工具或其他参考提供俾小弟?
    3.小弟都明白用D工具冇可能贏到莊家,至少唔輸到周身傷。同埋揾餐飯食下..哈

    馬克斯。

    回覆刪除
    回覆
    1. 長期賭波想戰勝馬會百中無一,16%水份不是那麼容易應對,個人覺得用什麼工具分析都是徒勞

      刪除
    2. 我同意你嗰說法,我都冇期望賭波戰勝馬會,只係想哪些工具都可以分析股票。

      刪除
    3. 1.vba主要用於處理data,多數只會用到一些簡單的function,遇到困難直接在網上search,一般都能找到解決之法,網上有很多範例。

      2.分析是否有效根本還是在於自己的算法,工具只是輔助性質,不會自動解決問題,應先有了可行的算法才去找合適的工具。

      3.不建議長期在fixed odds彩池搏殺。

      刪除
    4. 池兄,明白。
      如果想將每個球賽過往績儲喺數據庫,用excel或access好D?或者有其他途徑?例如想編寫好似馬會數據中心對賽往績嗰格式。

      刪除
    5. 哪個好在於個人習慣與喜好而已。

      刪除
  22. 請問池兄
    1.time since last race 這項factor, 池兄能獨立用嗎? 還是建議跟什麼合成, 我無論怎樣試也是不行(p value接近0.9 >.<)
    2.benter的文章建議過'compensation for bad luck in past races'這項, 池兄知道是指什麼嗎? 或是具體能怎樣用數字表達?
    3.'compensation for advantageous or disadvantageous post position in past races' 同上

    回覆刪除
    回覆
    1. 1.呢個既可以係factor亦可以係條件,合成時要很清楚自己想怎樣用,想這個factor或條件怎樣解釋結果,不能心裡沒有主意而希望撞出一個有效factor來。

      2、3.即係要評估返上仗的賽果是否賺/蝕了形勢所致,要每場睇返片做記錄先得,仲要將賽後報告數據化。

      刪除
    2. 如果唔想睇片,可以信馬會,用沿途走勢評述,留意最後寫既 二百米評述,多數寫有無受阻或者望空,應該會符合bad luck 既要求,但係唔知good luck 又需唔需要減分呢?

      刪除
    3. 唔睇片作用不大,一句「受阻」顯示不出程度,受阻可以影響一個馬位也可以影響十個馬位。

      刪除
  23. 今晚國際騎師賽,睇嚟4場賽事edge都會唔少... 池兄準備好彈藥今晚出手未?

    回覆刪除
    回覆
    1. 池兄可以趁今晚試下賺埋回扣,之後分享下成績吖

      刪除
    2. 不明朗因素多左,好易中伏。

      刪除
  24. 頭三場都係搵錢的場次,池兄今日收穫應該唔錯。

    回覆刪除
  25. 昨天向池兄發電郵請教注項分配,煩請池兄指點

    回覆刪除
    回覆
    1. 不好意思,近幾個月郵箱一直被轟炸,根本覆唔切,所以好多電郵都唔會覆,就算覆也會很遲且很簡短。
      如果問題緊急,可以直接在blog裡留言,就算池某未能解答,相信也會有高手仗義幫忙。

      刪除
  26. 池兄,

    小弟已經 系池兄blog 瀏覽多時,
    知道池兄 數學能力高,小弟不才,
    現時還未學會Kelly Criterion的應用。

    小弟慣於 統計歸納賭博公司過往開出的盤口,
    雖然費時勞力,但都略有一些成果。
    規納到一些 盤口有78% 至 90% 的勝算。
    但賠率 較低,在1.3 至1.7 的範圍。

    可惜這個方法,未為我帶來贏錢,卻越輸越多。
    就好似 星期六晚,我搜納到 5場賽事盤口在我目標範圍。過往統計勝率於78%至85%。

    由於呢排運氣不佳,剔除了2場,組了條3串1。
    結果 偏偏85%勝率的輸掉了,也在我的3串1當中。
    5場 只有1場輸,偏偏我選中。

    這種情況經常發生。不斷累積統計依然保持75%以上,証明方法無錯。每次大注追數都失手,越追越多。
    等待這些盤口出現已經很難,難得有幾個出現,急於追數,串Q 又偏偏選中輸的。真系好氣餒。

    真系好累。
    等盤搵盤-> 靚盤出現 -> 大注 -> 輸 -> 調整,發覺統計勝率方法無錯 -> 結論:自己無運 -> 再大注追 -> 再輸。無限輪迴

    池兄,可否比些意見。


    池底泥 上

    回覆刪除
    回覆
    1. 使即每場勝算有80%,3串1過關的勝算也只有0.8^3=51%,輸贏機會只是一半半,不能說贏面很大,大注是沒理由的。
      假設三場的勝算都是80%,賠率都是1.5倍,用simultaneous Kelly可計算到大致注碼分配是這樣:
      1# 14.4%
      2# 14.4%
      3# 14.4%
      1+2# 9.6%
      1+3# 9.6%
      2+3# 9.6%
      1+2+3# 6.4%

      3串1那注只值6.4%而已。

      刪除
    2. 來同病相憐。

      在下的孖膽模營在上月略有營利,然後在這月初連輸之下,昨天連本帶利只剩下二百零三元。於是在今天兩場孖膽中只能選取一場,結果選上有多寶的一場沒中而清袋,沒選上的那一場卻中了模型的第十八注……

      得到的啟示是當本金不足以承受波幅的情況下,模型的好壞也並不足以覆蓋隨機運氣的影響。

      快餐人上

      刪除
    3. 孖膽是一個考耐力又考運氣的工程, 又未能以 Kelly 做到倍增效果, 加上投注額偏低 (尤其賽馬日, 沒累積多寶情況), 用數學模型去計的散戶也日漸增加, 中得到也未必能長線獲利 ... 池兄也試過連續 40 多次也未能中一口, 粗略估計都有一萬元 ... 若早前沒有盈利, 這一萬元 (甚至更多) 你能捱得過去?
      路人甲

      刪除
    4. 年代不同啦。以前呢個彩池就算很容易中的組合閒閒地都派七八千元甚至過萬,中一次就有排搣,輸多幾次都撐得住。
      賭博肯定是很受運氣的影響,下注的次數越少,運氣的影響越大,但越是長線越不能賴運氣,關鍵還是在於自己的算法是否比其他參與者大幅優勝,不但不能停步,還要不斷取得突破。

      刪除
    5. 現實已經證明捱不過去,不過也並非毫無收獲。實際下注後有比較直觀的感受,察覺到模型中一些以前未發現的不足,有些設計應該可以再作改進。

      快餐人上

      刪除
  27. 自以為找到良方,
    實際勝率 原來如此低,
    甚至是不值投注.

    過往雪球越滾越大,
    根據simultaneous Kelly,
    我想我要相當長時間追數.

    池兄,
    我有用池兄介紹的這網頁計算.
    https://www.sportsbookreview.com/picks/tools/kelly-calculator/

    但請問一下, 如將這網頁 轉換成excel,
    有無網頁介紹?
    我找了好久 都沒有simultaneous Kelly的Excel .

    池底泥 上

    回覆刪除
    回覆
    1. 網上應該沒有simultaneous Kelly的Excel。過關版本相當難寫,亦不常用。

      刪除
  28. 想請教池兄
    factor上次出賽日期, 如何應付一些未出過賽的新馬?
    這種日期長短的factor, 隨便作個constant數(0日, 999日之類)好像怎樣也不太合適, 應該如何做呢?

    回覆刪除
    回覆
    1. 0同999之類都可以的,最重要的是每隻新馬的設定要保持一致。

      刪除
  29. 不明白一點
    參數值會顯示越大越好或越小越好, 如果出現越小越好, 則0佔優, 反之則999佔優.
    這樣不會影響其他正常日子間隔的馬嗎?

    回覆刪除
    回覆
    1. 那其他馬是休息了3天的優還是300天的優?

      刪除
  30. 在下真是愚鈍
    池兄意思是不用理, 模型自會給答案?

    回覆刪除
    回覆
    1. 不是的。休息日數不像完成時間或名次那樣明顯單邊趨向,可能不是單向的,也不是linear的,甚至可能是因馬而異的。這樣的factor未必簡單處理就能做出效果,可能需要一些transformation或combination。

      刪除
    2. 多謝池兄耐心啟發
      在下要努力試如何用得上此參數了

      刪除
  31. 今日只中第3、5、8場,池兄戰果如何?

    Dicky

    回覆刪除
    回覆
    1. 嘩,中親都冷,成績好過池某好多。池某今日淨係識中熱門。

      刪除
  32. 我個Model 今日有個怪現象,大部分機率都唔係大熱門,只係次熱或第三熱,所以熱門賽果反而唔中。

    Dicky

    回覆刪除
  33. 原來2018年季初輸錢個果係你,留意左你好耐(在馬會的電算機上).
    你的文章很有啟發性,好可惜有很多我不太明白.
    我只懂一點EXCEL,想在賭博上找一點被動收入,發現是極度困難.
    希望你可出一些教學啦!

    回覆刪除
    回覆
    1. 2018年馬季未開鑼喎,唔好咒我啦。XD

      刪除