2017年1月15日 星期日

重整賽馬model之後,以近兩個月的戰績來看,出現虧損的頻率與幅度大幅減少了,同樣,盈利的頻率與幅度亦有減無增。原因是,越來越多的場次是這樣的情況:


和局。無注可下。

雖說two-step model會令計算結果與實際賠率趨同,但完全沒有edge的和局,只有在所計算的期望賠率與實際賠率極接近時才會出現。這說明了賽馬市場和股票市場一樣,雖然不是完全有效,有些時候還是相當有效的,並非遍地傻錢任由予取予攜那麼簡單。

若細看盈虧的具體場次,更能說明這一點,越是資料充足、平淡無奇的賽事,就越難找到下注空間,這是因為其他參與者也能在機會率與賠率之間作出冷靜的判斷。反而在有一面倒明星馬的場合,存在更多不理性的錯價,每次“巴基之星”、“京京千里”這些不乏死硬捧場客的明星馬落敗,利潤總是特別豐厚。

不過,要在這種場合搵食也不是一容易的事。明星馬之所以備受大眾追捧和信賴,當然是有其過人之處,即使是機會率被過份高估,實際的贏面還是很大的,要從其對立面贏錢,首先是要輸得起,而且可能是連輸很多次,才等得到一次除笨有精的高回報機會。

這樣的操作好像似曾相識,不錯,《黑天鵝》作者Nassim Nicholas Taleb在介紹其期權操作時也是這樣說的,他的目標是下不對稱的賭注,不介意不斷輸點小錢,一旦被人嚴重低估的事件發生,就能得到超常規報償,一次過連本帶利取回所輸的,甚至遠遠超過。

看來,投資博奕之道確有很多相通之處,

談到博奕,池某只是完全不入流的低手,至少,池某家裡的化骨龍是這樣認為的。特別是那條小化骨龍,他的第二偶像叫AlphaGo,第一偶像叫吳清源,為了沾染一下這位被稱為“神”又被稱為“聖”的猛人氣息,他還特別跑了一趟地獄谷溫泉。據他說,吳清源認為對奕的最高境界,就是“和”。

好奇之下查看了一些資料,原來此“和”並非彼“和”,而是跳脫局部,不過份計較一時一地的得失,放眼大局下的和諧。

池某乃此道的門外漢,未必能完全理解這位“神人”、“聖人”的高深智慧,但套用到池某熟悉的語言,似乎也說得通:跳脫片面的思考,不過份計較一場一局的得失,放眼大數法則下的edge

177 則留言:

  1. 池兄有波馬股三頭馬車,已經做到放眼大局下的和諧啦。

    回覆刪除
    回覆
    1. 波是肯定拉不動的,最多只能搵餐下午茶,對馬的憧憬大一些。

      刪除
  2. 投資也是一樣,個別股票或組合拎去做爛頭卒唔緊要,戰術上犧牲小我完成大我,在整個資產配置的大局上能夠令到總身家達到戰略目標就是勝利. 這就是 war 跟 battle 的分別.

    回覆刪除
    回覆
    1. 魔師兄的組合配置可作排兵佈陣打「war game」的樣版了。

      刪除
  3. 呢篇文可圈可點,
    (1)雖然不是完全有效,有些時候還是相當有效的----股市就是如此. 所以才有利潤空間. 市場錯價買入, 市價有效賣出, 或相反情況配合期權也可以.

    (2) 股市都係資料充足,多基金佬大戶玩既藍籌, 錯價機會比較少, 細股錯價機會比較多, 從而做成更多找尋利潤的機會(同一時間更多老千股玩既機會, 哈哈)

    回覆刪除
    回覆
    1. 呵呵。可惜賭馬不用理會賣出問題,所以太有效是弊多於利。

      刪除
  4. (3) 我現在買股都是'大數法則下的edge', 只要strategy正確, 間唔中個股出現不良結果, 其實是正常的事, 可以果斷換馬, 只要組合average回報好就可以了.

    回覆刪除
    回覆
    1. 池某覺得市場裡的edge其實就是眾人的錯誤,所以搵edge就是捉錯。

      刪除
  5. 吳清源認為對奕的最高境界,就是“和”----呢個境界,有d似古龍小說'圓月彎刀'中兩大高手沒有真正大打出手時的境界. 池兄睇過呢本小說未?

    回覆刪除
    回覆
    1. 金庸、古龍、梁羽生,都是讀書時候睇的,現在差不多都還給他們了。

      刪除
  6. 池兄此文精深, 塘人要睇多幾次至明一點點, 實在愧疚XD

    回覆刪除
    回覆
    1. 見笑了。此文草草而就,只是想說說最近賭馬遇到的情況,並沒什麼大道理要說明。看來是池某表達能力太差之過。XXD

      刪除
  7. 原來池兄賭獨贏的情況如此,少了池兄這個大戶,怪不得近來的綠格、啡格也少了!哈哈

    話雖如此,池兄在連贏方面的近況如何呢?

    回覆刪除
    回覆
    1. 若獨贏冇edge,連贏的情況亦所差無幾。

      刪除
  8. 求救...
    池兄 我excel的data突然同我來個大兜亂,果日一開excel,有公式沒公式的很多都變了實數0.01......有沒有辦法復原,不然逐格打返我會想死...

    回覆刪除
    回覆
    1. 呢個方法唔知得唔得:
      http://zh.wikihow.com/%E6%81%A2%E5%A4%8D%E8%A2%AB%E8%A6%86%E7%9B%96%E7%9A%84%E6%96%87%E4%BB%B6

      刪除
  9. “他的目標是下不對稱的賭注,不介意不斷輸點小錢,一旦被人嚴重低估的事件發生,就能得到超常規報償。”

    哈哈幾似the big short入面嗰幾位仁兄喎。輸中有赢、赢中有和,人生同賭局一樣,達至equilibrium才是長久的境界。

    回覆刪除
    回覆
    1. Blog友們在留言和電郵問得最多的問題,是怎樣提高命中率。舉這個例子是想說明命中率越高越容易被大眾高估,命中率越低越容易被大眾低估,所以想贏錢其實應該思考怎樣降低命中率。XD

      刪除
    2. 首先我們要減低下單的密度,提升每單的expected value,我們不是goldman的超級電腦,是個普通地球人,鬥高頻必死無疑。慢慢賭,比較快。計掂數才賭。

      刪除
    3. 視乎edge是否明顯啦,為下注而下注實在不必。

      刪除
  10. Actually, for this race, #14 (over 1 to 99 on WIN and 1 to 9 on place)is too much under-estimated if you look at the sectional speeds he made previously on 1400 and had a huge edge on PLACE and QP, Of course, I agree winner and 1st runner up are 2 outstanding horses in this race and the WIN odds did reflect their winning chances quite effectively and no edge for win bets.

    回覆刪除
    回覆
    1. 厲害,99倍「獅子驄」都計到?!
      池某個model淨係可以計win,而place概率又由win來推,每逢呢啲場合就只能做觀眾了。

      刪除
  11. 池兄你用了多少時間才有今天的成果?

    回覆刪除
    回覆
    1. 這不算是什麼成果啦。
      對池某來說弄這些東西既是學習方向也是閑暇消譴,並非工作任務,故沒有時間概念。

      刪除
  12. In this race, win pool was quite efficient because #2 and #9 are outstanding....I understand many professionals using similar statistical models and kelly methods to bet on win and Q etc. In the past, professionals were not keen or not care about Place bets before...but actually nowadays place bets and QP sometime are very profitable because of more inefficiency for these pools. In last Sun races, there are many horses underestimated in place and QP pools. These horses may have tiny chances to win in these races due to presence of outstanding horses but they are very attractive in terms of getting into 2nd - 4th position in these races.

    回覆刪除
    回覆
    1. 請問兄台是用什麼approach去計算place probability?

      刪除
  13. 池兄is very knowledge in the horse betting field, especially using statistics for modelling and money management. My research in last few years showing it pays off if we more focusing on sectional time horses after sectional time has been published to public since couple years ago and pace handicapping has become more important for analysis of races.....as in the past, i think speed and trip handicapping were main streams.

    回覆刪除
    回覆
    1. 是的,池某的model也有部份sectional time構成的factors,確是比finish time更significant。問題是現在還找不到一個計算place probability的可靠方法。

      刪除
  14. Frankly,I also don't have a reliable model for place probability. Have been using Harville , Henery and Stern models for testing but now I still using win model as reference to predict place edge. I won't put place bets by using similar methods like we use in Win, Q, etc. The point I wanted to raise through this example is sometime we are too focusing and relying on these models and has become too mechanical. I think we also need to really think how likely the race will be run and then look at the results generated from your model.

    回覆刪除
    回覆
    1. 多謝分享。
      池某也覺得Harville, Henery and Stern這類建基於win probability的方法不太好用,其缺點是若win沒有edge,place也會沒有明顯的edge,像周日之戰池某的model計到6隻跑第二,雖然買place回報很可觀,但前提是要輸掉win。

      刪除
    2. 池兄, yes you are right. All these 3 models are not very effective. Place pools have been overlooked by professionals and mostly public betting on place pools (some time they treat it as their insurance bets to back up their win bets) and nowadays we have all suffered from "green" and "red" horses last minutes on win and Q/QP pools and edges have been reduced significantly.

      I see your table which reflects public odds a your calculated odds for win from #1-12, what about your calculated odds for #13 and #14? To me, my win model also said no edge to bet for win on this race...Actually, may be you also agree, it has become more often that win pools have become much more efficient than before.

      刪除
    3. 哈哈。那個是手機截圖,要scroll才能看到#13和#14,不過右邊那些 0 也能說明#13和#14同樣是沒有edge。現在獨贏的盈利空間真的很窄。

      刪除
    4. Yes, amazed with your own developed apps and it really handy.

      刪除
    5. 慚愧慚愧。那是同學IT人的作品,池某只是坐享其成的用家。

      刪除
    6. 位置彩池因為有個數學上的結構問題, 基本上比WIN更難捉到edge.
      Harville其實唔係無用的, 只係Base on一個單一的Win Probabilitty去計算, 出現誤差是正常的. 所以Henery和Stern所作出的修正是錯誤的處理辦法. 因為機率并不是一個點. 要提升準確度就要提升計算的維度.

      刪除
    7. 今晚很明顯,就算用Stern,都係place的edge大過win。

      刪除
    8. Dirt races are very inefficient and present huge edge. Because dirt races winning pattern or bias are very different from turf races. Many public are unaware of the winning factors for dirt races and still follow the logic and based on the performances on turf races. Data also rather limited comparing with turf races.

      刪除
    9. 是的。Dirt的最大問題是跑得少,即使個database已很大,涉及Dirt的數據也很有限。

      刪除
    10. But if data for dirt races are more (like those in the U.S.), then the edge will be min.

      刪除
    11. 數據太少自己的準確度亦要打折扣。

      刪除
    12. Yes data on dirt races are limited but if we know how to use the past performances of a horse in turf races to reflect the ability of the horse in dirt races + the bias on dirt track in shatin for different distances, then we would have a huge edge...

      刪除
  15. 【問題是現在還找不到一個計算place probability的可靠方法】

    這個我不熟。臨時諗到...
    可否用組合計算?(或者電腦模擬?)
    每馬的獨贏機會,就好似出了很多牌後的撲克牌,每款牌有多有少,然後計算某牌出現在三隻之內的機會。
    然後用過往記錄檢驗這方法的有效性。【公眾賠率最準】,就用公眾賠率來比對位置的派彩/或入圍機會率。

    回覆刪除
    回覆
    1. 這個做法似乎有些轉折,第一,公眾賠率是時刻變化且變化頗大的;第二,公眾賠率並非最準,我們就是要準過公眾賠率才能取得盈利。

      刪除
    2. 轉折,如果一個模型是直接計算出位置機會,其中包含了萬千轉折,現在只是多了萬千份一的轉折(也許計算獨贏機會已經比較計算位置機會少了千百個轉折?)。計算時間也應該不用半秒。

      賠率變化,睇取幾時的。。
      如果現在談的是有乜辦法計到位置機會(而不是哪一個模型較優),那么可以用最後賠率,來引證計算方法的好壞。有了方法,用到哪一個模型都可以。

      整體來說,公眾賠率最準...獨贏,好似係Bill Benter講嘅,也好似唔只一個講。
      電腦馬之可以贏錢,是因為找到其中少數公眾低估的馬。我打士碌架年結都是贏錢的,并非因為我最好波。
      如果有個系統,計算準過公眾,咪用它的獨贏機會率。

      刪除
    3. 結果又回到原點了,始終都係要先砌一個可以準確計到獨贏機會率的系統先得。

      刪除
    4. 是時候把精神投放在這個問題了,之前幾乎全部時間用在砌database同model。

      刪除
    5. May be we can think in another direction that place probability doesn't related to win odds or win probability at all if it seems no solid statistical methods to determine place probability from win odds.

      刪除
    6. 這個方向值得努力,由win probability推算place probability確實未有很完美的方法,常用的Harville和Stern等方法都各有不足。

      刪除
    7. Our main objectives are to find bets which will maximize the return not finding the winners.

      刪除
    8. 不過計名次的機會率比計winner的機會率更難。

      刪除
    9. Harville錯到九彩因為賽馬名次不是獨立事件,「一號跑第一後,out走一號,估其他馬邊隻跑第一」從而猜想誰是第二,邏輯上錯到暈。

      如果第一二三名跑出了,第四打後沒爭勝決心,hea到暈,咁又點計?每件事也是環環相扣。

      Benter仲x奇怪,佢竟然整個k2k3常數出嚟。越睇越奇怪,越睇越覺得佢錯。

      更有人用高斯分布去仲,明明馬匹實力個分佈就唔係高斯分布...夾硬用高斯分有去計,唔輸至奇。

      以我有限的數學知識,望落用MLR最正常...

      刪除
    10. Harville邏輯上不太通,實際應用偏差更是極大。不過在所有可以完整解決row sum和column sum問題的方法中,Harville是最簡單的。
      Benter's correction同Stern的常數是從MLR中找出來的,很明顯的一個問題是這些常數其實是變數,用不同的database得出的結果會不一樣。
      單用MLR的缺陷是雖然可以解決各個名次的column sum,但保證不了row sum。

      刪除
    11. 我有想過自己為每項因素比weighting,如負磅,馬的年紀,或者combo factors,再好多項夾埋一齊為每匹馬做評分;雖然較MLR人性化,但容易太主觀。而且點去set個weight又係一門學問,我又見到啲黃頁咁x厚的書,就是講weight點set。

      刪除
    12. weighting的誤差也是可以很大的,比如馬的年紀,有的馬2歲開始跑,到4、5歲已經跑殘,有的馬4歲才初次上陣,同樣是4歲,可以是朝陽也可以是夕陽。
      weighting的另一缺點是,去到最後,還是要假設馬匹實力是高斯分布,才能化作期望賠率。

      刪除
    13. 高斯分布評馬唔得嫁...理論上每匹馬一條獨立,形狀獨立的「f(x)」,比如常見的左偏右偏,甚至咩形態都得。如果無一個方法決定每匹馬的f(x)點樣,就係此路不通。

      試想想,同一馬匹大落後5個馬位,同快放5個馬位機率一樣?但高斯分布兩邊平衡,圖就話比你聽兩個機率一樣。
      一想到呢度,又係唔用得呢個方法。

      刪除
    14. 但要方便計算還是免不了要假設各種各樣的分布的,即使是MLR,其probability density function是double exponential distribution,與normal distribution也很相似。

      刪除
    15. Yes, we do need to have some assumptions on distribution and so far MLR is most effective and profitable for me. To me, for weighting of each factor, it is really an art rather than exact science.

      刪除
    16. 池老,想請教一下,我假設騎師甲「出戰一百場,十冠,二十亞,三十季」,但騎師甲的勝利,是團體的勝利,如馬匹,練馬師,場地因素 等等。點樣可以減走其他雜項,只看騎師甲對賽果有多少貢獻?

      刪除
    17. //we do need to have some assumptions on distribution
      我們追求的不是絕對準確,只要比別人準小小就夠,方便計算的assumptions不是壞事。

      刪除
    18. //只看騎師甲對賽果有多少貢獻?
      要對個別因素做weighting是非常困難的。不過MLR正好可以解決這個難題,把想得到的因素都放入model做regression,結果雖不是一個具體的比例,但所得的參數大致顯示了各種因素重不重要和有多重要。

      刪除
    19. 謝謝,又學到嘢。現在整理一下模組先,下季應該開始計馬之旅。

      刪除
    20. Wing Lau: 我完全同意你睇法, 所以我一早已經說無用.

      刪除
    21. 我覺得步速係一個好關鍵既因素需要解決. 例如, 假設一隻馬計到50%會WIN, 這當是一個點啦. 但現實唔係咁麻. 再進一步會可能係
      慢步速: 0% WIN
      中等步速: 75% WIN
      快步速: 90% WIN
      再延伸落去, 就要估算步速的出現率.
      再要估算突變..(因為好多時快馬多, 但如果大家都想贏, 就好多時變為慢步速.)
      好可能運算出來的結果是:
      20%會 慢步速: 1,2,3號 最大機會
      50%會 中等步速: 2,3,4 最大機會
      30%會 快步速: 4,5,6 最大機會
      這樣, 要點下注呢?

      刪除
    22. 步速問題真係好難解決,池某之前做了一個步速factor,沒有效果。難點係就算大致能判斷步速,也很難估到馬匹的走位,點估到「超有利」會放頭?

      刪除
    23. 河馬兄,以我有限的數學知識,理論上每匹馬的總注碼由3個組數合成,20%慢步速x0% win,買獨贏計自然是不投注。50%中步速,要用kelly計曬咁多隻馬在中步速會點,依比例下注;30%快步速同理。最後3舊加埋,就是每匹馬個別的投注額。但是總金額也因此變成三舊,慢中快步速儲備金。

      刪除
    24. 我的推論步速 x kelly時,是否不合乎統計學/數學邏輯??大家都沒回應,我推論錯可以屌7我。有則改之,無則加勉。

      刪除
    25. 呵呵。應該不是邏輯問題,而係計算步速的概率不比計算頭馬的概率容易。比如中等偏快步速點分配,中等偏小小慢果「小小」又點釐定等等。

      刪除
    26. How about thinking in this way: do you know how accurate you predict the pace of the race? 50% of races you handicapped you got the pace right? or 70%? what distance or even tracks you have better prediction so far?

      These are the statistics of your skills. Similarly, you should know your hit rate and yield % for different types of bets such as win bets, Q bets, etc.

      If you say you know this race you would 70% hit on your pace prediction, will this be a valuable factor our bet model?

      Overall, pace is very critical factor especially on HV sprint races an dirt races.

      刪除
    27. 有幾點很難把握:即使大致可以預測到步速偏快還是偏慢,卻無法預估到會快多少或慢多少,於是也無法計算具體對各個位置的馬匹影響有多大;另外馬匹的走位也無法預測,諸如放頭馬出閘慢變成拉後跑,或居中馬因外檔望空索性推前跑扯快步速等等。
      池某試過用幾種方法去做步速這個factor,效果都不太顯著,反而做哪個路程較利放頭或後上這樣的分析容易些。

      刪除
    28. 我嘗試過用步速/段速去計算, 有時一場會有6-7隻範圍馬,有時就得1-2隻,效果呢...最冷過隻係旅遊智者99倍第2, 那一場只有2隻範圍馬,結果係第二第四. 星期三那次呢...
      第一場: 1,2,3,5,6,12 (四連環)
      第二場: 1,8 (PQ)
      第三場: 1,2,8 - 6 11 (PQ)
      第四場: 2 4 5 (P)
      第五場: 十隻 (不計)
      第六場: 1 (P)
      第七場: 8隻 (不計) - 但飛走精氣神同包裝鬥士
      第八場: 2-7 (PQ)
      其實D個辦法我覺得都可行, 但要解決的事太多. 要有很多地方修正.
      係解決唔到中段變速的馬.(2同8場個隻) 同埋質新, 最近做緊個改良版.
      但未完成..

      其實做任何事, 大家面對的困難都是差不多. 解決到個困難就係優勢.
      而每一個系統, 都有其長處同盲點. 好多時都係結構問題. 要怎樣補洞呢? 都是一個學問.

      刪除
    29. 是的,成功的系統都要具備兩個基本條件:
      1.持續穩定,可重複操作。
      2.能戰勝公眾賠率。

      刪除
    30. 河馬兄, yes your model seems pretty good based on the contenders you selected but may be too many contenders and cannot be eliminated sometime. If you know how the horse can perform under different pace scenarios and then you know pace bias for the track and distance...you should able to find some good value bets.

      Yes, 中段變速的馬are difficult to be predicted in advance but this factor doesn't bother me too much on using pace and sectional speed analysis..like race 3 of Wed, My top choice is 琪麟穎 and actually it didn't really won because of 中段變速, if you know this horse from past performance, you can see it would be able to throw fast speed for the turn and last 300m even under moderate or slightly faster pace. For HV races, the time or acceleration the horse can make during the turn is critical.

      刪除
    31. 噢,呢場池某買了辣得很。
      星期三大部份大幅落飛馬都有池某份,辣得很22倍變12倍;傾心星13倍變7.1倍;最慘係隻包裝騎士,20倍買跑完得8.5倍,利潤被蒸發晒。

      刪除
    32. Yes, as more professionals now and really no easy to find good value bets now

      刪除
    33. 回PP, 琪麟穎之所以掉落次選, 是因為我的計算方式是預計他是內欄, 比較後位置, 按數據它會以一個標準差後於1,2,8..
      但現實是它在第二段從後殺上, 在入直路時如果估計它入直路的位置是第二排之前, 那麼, 它就會高於平均值.

      我這個模型的缺點好大, 如果跑法預計錯誤, 會好大出入.

      事後分析, 這一場次做出的時間, 及各馬的走位都不按慣性, 像辣得很, 它慣常是放頭跑法, 但它卻留後. 原因是放頭幾隻馬, 頭段時間比標準時間快標準幾線. 所以變相到第二段中後期會變慢.

      辣得很因為有馬做COVER, 他做出的時間, 其實是跟他放頭沒有分別.
      他有第二, 如果睇賽事, 他好像是追上來, 但從數據睇, 它只是維持原有速度.表現屬於常態範圍.
      琪麟穎, 由於他入直路時已經透出, 入直路的未段是23.90, 但第二段時間超快,按常態數據他已經透支了, 但這樣的減速幅度比預期小, 證明他的耐力比其他同場馬好.表現屬於常態以上範圍.
      這場馬大部份馬都表現正常, 唯獨隻1號, 表現是水準之下.

      其實自問分析完都唔知有咩用..因為每場馬都不同.

      刪除
  16. 池兄轉騎師這個参數您如何處理,我想到頭髮也白,也解決不了...謝.

    回覆刪除
    回覆
    1. 池某的model裡沒有這個參數,因為騎師本身的參數已經很significant,再弄一個相關的難免會撞。

      刪除
    2. 大膽問一問您,池兄你最多類型的factor是什麼???(例如:路程,時間etc....).我請教你應該從哪個方向走,諗factor. 謝....

      刪除
    3. 謝池兄解答...簡單5個字.令我得益不少.

      刪除
    4. 池兄是否應該集中火力研究馬匹最近的狀態???

      刪除
    5. 狀態很難量化,太模糊無法擺入個model。

      刪除
    6. 池兄的model是否變化類型的factor比較多???我的factor有sig.,但chi square 十分低.推不動alpha.

      刪除
    7. Actually, conditions can be considered as one of the factors but the tricks are the weightings you put under this factor for the overall score of the horse. My model found it is a super plus signal for contenders if the horse did fast workout recently under 22.0 sec in final lap.

      刪除
    8. PP,你好,我的MODEL也有尾段速度,我的做法用佢秒速計算...你會刻意用22秒做條線分開兩類馬計算?

      刪除
    9. 插嘴一問,大家建議用全部段速還是只用尾段速度作factor?

      刪除
    10. 小牛...兩類我都有加入model內.

      刪除
    11. 末段時間同標準時間比較更有效,直路1000跑22秒唔出奇,快活谷1650跑到22秒就真係堅。
      另一個做法係同first call比較,後上馬較多可以末段跑22秒,放頭馬好少。

      刪除
    12. 多謝2位高人,想請教多一個問題,你們計步速是直接用時間(秒數)還是轉為自訂分數?

      刪除
    13. 我是用米/秒.
      池兄如果用頭段時間比較有個問題.每條賽道的頭段距離都唔同.有的200米,有的400米.應如何處理這個差距???

      刪除
    14. 多謝師兄,如果只用上仗的段速來作factor可以嗎, 還是有更好的建議?

      刪除
    15. //有的200米,有的400米.應如何處理這個差距???
      同標準時間比較,或用first call位置。

      刪除
    16. //只用上仗的段速來作factor可以嗎
      用多一兩場會好些,撞o岩上仗跑軟地就失準了。

      刪除
    17. 可以考慮以每100米的平均速度, 或者以每秒跑幾多米作為取樣

      刪除
    18. 用多一兩場會好些---一定要用相同路程嗎?

      刪除
    19. 同標準時間比較就不用理會路程問題。

      刪除
    20. First, my previous post said 22s in last lap applied to workout not applied for real races...mean if I saw horses can throw very fast time <22 s) for last lap on their training workout, I'd increase his condition factor.

      Regarding sectional speed analysis, I think I wrote to HKJC to ask why they didn't capture sectional speed about 7 to 8 years ago and by that time, you can either clocking the sectional time by yourself or through one of the horse web from a newspaper website which provided sectional time for each race back in 10 years ago I remember. I don't know how much these sectional time data have been used since they are publicized but certainly professionals are using the data quick a lot.

      I normally express in speed, i.e. m/s. for each section. From sectional speed, we can get 2 important pieces of information: 1). the ability of a horse to accelerate within a short time; 2). energy distribution for a horse in order to win. These are very important information if we combine with the running style of the horses + the probable pace of the race.

      Normally, people think fast pace favors late runner from behind and slow pace favors front runners. But actually, this is not really the case...some horses say in 1400 you can see they can run no less than 23s in last 400 even very slow pace but some can run 21.X under very fast pace...knowing the characteristic of a horse is very important.

      刪除
    21. 了解
      多謝解答

      刪除
    22. //people think fast pace favors late runner from behind and slow pace favors front runners.
      這真是個錯覺,池某之前做了個步速factor,效果不明顯,細看之下發現原來快步速不一定不利放頭,慢步速也多數是後上馬(比平時跟前了小小的後上馬)贏出。

      刪除
    23. If possible you can also investigate sectional time of first 200m and next 200m of last 400m to see how the horse run...you may discover something new and beneficial for your model.

      刪除
    24. 有難度呢,200米的段速去邊度搵?

      刪除
    25. 想請教大家如果遇到軟地/泥地賽事.大家會點處理.我自己就有理無理用標準時間作base去比較.但諗諗吓只用時間又不能完全反映軟地/泥地的影響.

      刪除
    26. 泥地也有標準時間,不成問題。軟地就真係個問題,不知道combine埋場地指數能否解決。

      刪除
    27. Normally, I don't bet when the track is affected by rain as most data are on good tracks.

      刪除
    28. 200米的段速去邊度搵?I normally recording the time by myself by seeing the video of races.

      刪除
    29. // I don't bet when the track is affected by rain
      數據處理也會跳過黏軟地賽績嗎?

      刪除
    30. I used to include 黏軟地賽績 data in my model but recent years found could either mislead or not helping much....now I don't include 黏軟地賽績

      刪除
    31. 呢個問題真係要諗諗。之前做了一個場地適應性的factor,效果不佳,原因是好快地與好地差不多,好黏地有時跑出來的時間比好地還快,真正黏地的data少到真是可以忽略不計。

      刪除
  17. 回覆
    1. 兄台若有睇開呢個blog應知道池某對馬冇認識、冇感情、冇心水,買定唔買、買邊隻、買幾多都係開閘前一刻先知。

      刪除
    2. 我知道,或者咁講開閘前兩分鐘分享下你分析結果

      刪除
    3. 閘前2分鐘池兄都落緊注啦,點分享得切?
      分享到你都買唔到切啦,太早分享又唔準
      結論: 冇得分享呀

      刪除
    4. 閘前2分鐘未落注,而且未知買邊隻,賠率變化決定買唔買、買邊隻(所以要link馬會即時賠率計到開閘前一刻),EO的變化都係跟隨RO,所以冇賽前分析結果。

      刪除
    5. 在這高手交流心得之地竟有人有臉要求別人分享分析結果,而不落手嘗試做模型......

      刪除
    6. 師弟你已經閉關半年,是時候寫寫最新研究成果了吧。XD

      刪除
  18. PP兄有點深度, 有機會真的想交流一下.

    回覆刪除
    回覆
    1. Thanks for your compliment. Yes, I am glad to be here to learn from others as there are many knowledgeable bloggers here.

      刪除
  19. 池兄個model可唔可以透露用緊幾多個factor??? 同埋呢D FACTOR 係咪要深入重覆睇片先可以攞到???謝謝賜教

    回覆刪除
    回覆
    1. 而家50個左右,剛砌完新的database,陸續增加中。池某賭馬唔睇馬,冇需要睇片的factor。

      刪除
  20. 想問問池兄,會否用同類factor?
    例如幾段段速,今季及之前幾季獎金,不同距離之速度......等等
    聽說過同類factor不能重疊用,因為會撞,但合成又好像來來去去都是乘除路程班次之類,小弟亦試過,但很多都還是沒用,池兄能找到50個factor,不知能否提點一二?

    回覆刪除
    回覆
    1. Chi-Square極大的factor可以重疊使用。當然最好還是找獨立的。同類的會相剋相撞,獨立的會相輔相生。

      刪除
    2. 有試過騎師勝率和人馬合作勝率,都會撞.
      1. 又試過用同一個數合成,路程x重量和路程x其他factor,這樣用路程來乘factor,因為路程,班次這些很多都會用作合成, 這樣會形成同類factor嗎?
      2. 網上看到有些文章寫會用草地最佳時間,泥地最佳時間,生涯最佳時間,上仗時間,這些也是同類,為什麼別人用就沒有問題?(小弟試過上仗時間和前4仗時間都撞)

      刪除
    3. 敢問池兄說過計得精彩的MLR再做下去也不會成功,可否給予提示最大的問題在哪裡???相比池兄的model兩者有何關鍵性分別? 謝賜教

      刪除
    4. 1.路程和班次不會形成同類factor,但重量會。
      2.不會撞。但要注意砌model像起屋,應先盡量將地基砌闊D,而不是不斷加高同一面墻。

      刪除
    5. 計得精彩的MLR是one step model,且完全被賠率dominated。

      刪除
    6. 謝解答
      "但要注意砌model像起屋,應先盡量將地基砌闊D,而不是不斷加高同一面墻。"
      意思是要先有理冇理想到什麼factor都先記錄,等採樣有返咁上下先篩選嗎?
      剛看到有師兄問model,想問池兄,two step model 的winning probability data是會不斷更新的,待run了一段時間後(例如又過了幾十場),需要又再全部重新update一次data去計beta嗎?

      刪除
    7. 1.起屋論,意思是不要一次過砌太多性質類似的factor,應將不相關的砌左先,到時就會明白上面「相輔相生」那句話是什麼意思。
      2.池某的做法是不斷更新的,每個賽日都重新計算。

      刪除
    8. 謝謝
      1. 小弟也是有這樣做,就是砌了很多不相關的,結果真的是不相關所以才想是不是應該盡力發展有用那些,例如出賽距上仗差多少天,是否新馬,重量轉變等,但都chi square細到無倫,其實以上所提的是否真沒價值的factor?
      2.原來如此,小弟要人手在excel逐場copy&paste><

      刪除
    9. 多數都是有價值的,但不能漫無目的地砌。例如只睇體重輕左或重左,可能並不能反映出太多的訊息,如果隻馬休息了3個月呢,輕重之別反映出來的訊息就很不一樣了。

      刪除
    10. 謝池兄提點, 唯有不斷嘗試了.
      問多一個問題,R n B的論文的馬匹速度是主張以完成時間跟該路程最佳紀錄時間比較,但也有人用來跟標準時間比較,到底那個較effective?

      刪除
    11. 池某沒試過與最佳紀錄時間比較的效果,只做了跟標準時間比較,非常有效。

      刪除
    12. 池兄是用 multinomial logistic regression 嗎?

      刪除
    13. 池兄,
      1.看 LikeliHood Ratio Tests 中的 Sig, 還是看 Parameter Estimate 中的 Sig, 來決定此 Sig 是否應該保留在模型?
      2.池兄曾說過大的 Exp(B) 應刪除, 是說第一名中的 Exp(B), 還是每個名次的 Exp(B) 過大都要刪除?
      3. 如果在 Parameter Estimate 中, 有不顯著的 Factors 和過大的 Exp(B) Factors, 應該先刪除哪個呢?

      刪除
    14. 看Parameter Estimate中的Sig,要綜合來看擬定一個次序,先刪有害的,再刪無益的。
      有害的:
      Parameter Estimate若應正卻負或應負卻正,即刪。
      Chi-Square很小而Hazard Ratio很大,即刪。
      無益的:
      Chi-Square太小或Pr > ChiSq太大的。

      刪除
  21. 池生
    第一次留言,同你拜個年,
    祝你心想事成!!馬運亨通!!
    你個blog勁正,令我獲益良多(^^)b

    回覆刪除
    回覆
    1. 多謝。祝Man兄財源廣進,馬到功成。

      刪除
  22. 想問問池兄,應該如何「找準」下注時間?

    小弟視「開跑前一分鐘」為合適下注時間
    然而由於各種情況,賽事甚少按預定時間開始
    嚴重時遲上數分鐘更是對Kelly影響巨大
    弄得只好盯著螢幕等,以紅燈亮起為號下注,
    人若在外實在難以適時下注。
    不知池兄有無良方解決有關問題?先行謝過。

    另祝池兄心想事成,財源廣進。

    回覆刪除
    回覆
    1. 這個問題確實沒有良方,池某也是開跑前後賠率劇變的受害者,有時聽住電台等到最後一隻馬入閘才下注,仍無補於事。連結即時賠率的two step model可減輕衝擊,但還是不能根治。

      刪除
    2. 池兄,先祝賀你新年進步,投資順遂。
      小弟不材,想請教為one step model,又何為two step model?可否舉例說明,謝謝

      刪除
    3. 直接以model的參數計算概率為one step model;以model的計算結果加上賠率再做一個model得出新的參數,為two step model。前面幾篇文章的留言中有相當詳細的討論。

      刪除
  23. 池兄,想問問你model內的參數是否全都強而有力,為何這樣問?因為我model內有25個參數,當中有接近三分一的p-value位於0.02-0.05,名義上這是有效參數,但chi-square太細對組合供奉不大;現在大樓的基坐看似很闊,可惜一面對two step model的考驗就不堪一擊,結果難以接受.下一步應該如何走.請池兄指指方向. 謝.

    回覆刪除
    回覆
    1. 池某的model也有幾個參數不是很有力,因為隨著data的更新會有變化,故保留下來再觀察一段時間。
      在two step model與賠率相抗衡大約要30個有效參數。

      刪除
    2. 感謝池兄解答.我會繼續測試和改良.

      刪除
  24. 池兄 新年快樂! 新一年祝大家"必得勝"
    有一些問題請教池兄

    1. kelly問題, 有時遇到一些很熬的馬(1.1~2倍幾那些), 有些模型會計到很大機會羸, 往往會令kelly分配8,9成注碼下去買win, 剩下1,2成才建議去買其他冷馬, 但很多時候大熱都會倒灶, 如上次雷神的嫡愛寶, 但如果把大熱門剔除唔買, 成個kelly又會錯晒, 請問應該如何處理?

    2.想問池兄場地參數可以怎樣做, 場地本人只能想到yes/no參數, 可否給點頭緒?

    回覆刪除
    回覆
    1. 新年好。
      1.用two step model會冇咁傷。
      2.池某的做法是用馬匹在該場地的最優名次,不過觀察了一段時間呢個factor都係不太significant,現在頭痛緊。

      刪除
    2. 1. two step model面對的問題是遇熱越熱, 本人還是計得不夠準, two step完後完全集中到熱門上, 原本可買的冷門都變得不能買.
      2.對著什麼c, c+3跑道,又沙田又快活谷, 本人真的毫無頭緒, 哈哈

      刪除
    3. 1.應該不會完全集中到熱門,開一面倒熱門多的賽日池某輸錢居多。
      2.跑道本身不能作為一個factor,要與其他變量組合,例如檔位等等。

      刪除
  25. 1.現在本人如果遇到很熱但又計到高機率的馬, 寧願不買大熱, 小注冷敲其他冷馬, 好衰唔衰很多時2.5倍樓下的大熱卻是由頭帶到尾, 10場開7場熱門果日, 本人輸到喊.
    2. 跑道真沒辦法, 本人是用路程跟場地(跑道沒算在內)來分檔位勝率, 但好像沒什麼用.

    回覆刪除
    回覆
    1. 1.賠率2.5倍以下代表大眾並沒有明顯低估這隻馬,要從這隻馬身上贏大錢是很難的。
      2.檔位應是很有效的參數。

      刪除
    2. 所以機率高2.5倍以下也是應該買, 不然就不要玩那場?

      刪除
    3. 由kelly calculator決定,不要人為決定。

      刪除
  26. 補充一問池兄,正常是有edge才下注,但如果計到高機率但沒edge的馬,是否就不下注,而是去買機率低但有edge的馬?

    但很多時機率低就真係會跑到連影都冇,小弟目前是看機率x賠率大於1就會下注,但問題是臨場突然變勁冷的,越冷edge就越大於1,沒錯是edge很大,但有時會出現幾隻叫我買擺明是會包尾的馬, 結果跑出來就是熱門或是頂多半冷門,用去投注多隻大冷的就得不償失,這部分該如何取捨?

    回覆刪除
    回覆
    1. 沒有取捨的問題,下不下注,下多大注碼,不需要主觀判斷,交由kelly calculator決定就得。
      要用multi kelly calculator,不能單憑機率x賠率來決定。

      刪除
    2. 想問問multi kelly,小弟用excel整,用k*(o*p-1)/(o-1),k=capital
      為什麼計算結果出來池兄提供網上那個calculator有點不同,數字大約一樣,但差了一點,而且有些網上叫下注的馬,我自己那個就不叫下注,是不是我用錯了公式?

      刪除
    3. 公式不對。multi kelly較複雜,要計晒14隻馬再分配比例,不能用單一公式來計。

      刪除
    4. 池兄能否提供那條公式?

      刪除
    5. multi kelly不是一條公式,是一個計算系統。想用現成的可以在網上search一個multi kelly calculator來用;想度身訂造方便使用也可以自己寫,參照呢個思路就得:
      http://poolshunter.blogspot.hk/2015/09/blog-post_19.html

      刪除
    6. 再考慮同時投注“主”及“和”的情況,透過Dutching calculator的計算,同時投注“主”(1.87倍)及“和”(3.4倍),回報為1.2065倍,而“主”及“和”兩個選項覆蓋了0.592+0.285=0.877的機會率,故最佳投注比例為(0.877*1.2065-1)/(1.2065-1)=28%。

      爬了池兄的文,還是有不明的地方,假設14隻馬,只計W,
      最佳投注比例是(14隻馬的總機率*總回報-1)/(總回報-1)?
      還是(各自機率*總回報-1)/(總回報-1)?
      應該是邊個乘邊個?
      小弟想自己用EXCEL整,請池兄指點

      刪除
    7. 要用1至14號馬任意組合的機率和回報而得出投注比例最大者。

      刪除

    8. 咁睇黎不能直接用EXCEL搞了

      刪除
    9. 池某見過IT人直接用excel就做到,唔使用solver唔使用vba。

      刪除
    10. 望塵莫及也!

      刪除
    11. 呵呵。IT人係勁人,佢在市場(主要係股票市場)贏取暴利真係靠實力同解決問題的技能,唔似那些所謂大師除了口水就只有口水。

      刪除
    12. 香港做過GS DB 這類金融搞事棍的IT人是有...但bet365 willian hill等搞事棍的IT人就應該無....。所以在香港只能賭金融為主...馬波為副...。

      刪除
    13. 所以IT人需要Maths佬的optimization理論,Maths佬又需要IT人automation技能。

      刪除
  27. 【multi kelly】好多人問,但是除了網上找【multi kelly calculator】,“如何計算”好似未有出現過。
    如果池兄唔反對,我可以貼出計算方法。

    回覆刪除
    回覆
    1. 當然不會反對,知識是全人類的。
      若有簡單的計算方法,池某也想學。哈哈。

      刪除
    2. https://i.imgur.com/SzOpWks.png

      https://i.imgur.com/qc02cUT.png

      刪除
    3. 多謝macaupro兄的提供。
      Kelly計算部份是對的,與池某所用的方法也很相似,只是格式完全相反。
      有興趣研習的blog友可以嘗試將之融匯貫通,打造適合自己的個人化版本。這個基礎版本是不太方便match馬會賠率也不太方便下注的,連贏彩池會更為明顯。特別是two step model的使用者,還要考慮怎樣應對賠率時刻變化的問題,甚至馬匹臨場退出的問題等等。

      刪除