2017年8月25日 星期五

富貴直中取

首先要聲明一下,此blog的文章雖然水平很一般,無甚可讀性,然而每一篇皆為本人原創。敝帚自珍,池某不介意別人傳播這些文章用於知識性的討論,但不能容忍被用於商業或動機不明的目的。

昨日凌晨,有好心的blog友留言告知,有人公然竊取池某的文章到其自己的網站,又在FB的賭博group作動機不明的活動。基於上述原則,已立即針對懷疑侵犯版權的網站採取法律行動。


池某不知道類似的事件會否再次發生,也不知道會否變成另一種形式出現,且在法律的死角中滋生蔓延,而令正常的法律手段鞭長莫及,惟有在這裡重申:此blog每一篇文章的版權均為池某所擁有,除其中一篇曾供《信報月刊》使用外,不曾授權其他媒體、網站、博客或FB群組使用。

同時也要在這裡聲明,池某不會在任何FB群組活動,任何在FB或其他社交媒體、群組、討論區聲稱或暗示是池某身份的,絕對不會是池某本人。若懷疑有人藉此行騙,或因此而蒙受損失,請立即報警求助。

池某始終相信,富貴只能直中取,不可曲中求。要成為市場的贏家,應不斷磨煉提升自己的能力,堂堂正正從市場贏取自己應得的部份。諸如賣tips呃錢、賣口水授徒的曲線賺錢途徑,真正有能力在市場贏到錢的人不屑為之。

208 則留言:

  1. 唔知條友有冇冒埋你個身份...有損聲譽呢.

    香討有人冒充我, 仲左張女人相上去話係我老婆, 水洗都唔清. (有兩個老婆了!!)

    回覆刪除
    回覆
    1. 真係唔知。所以要出定澄清聲明先。

      刪除
  2. 池兄乃强者,自然有人抽水/抄襲~

    凡諗住盗取他人身份/知識獲利的,終有一日要還,而且要奉還更多更多。

    回覆刪除
    回覆
    1. 呢次池某好明顯係受害的弱者。

      刪除
  3. 回覆
    1. 唔知有冇冒充。copy左池某啲文去佢自己個網就肯定係。

      刪除
  4. 回覆
    1. 用你文章作招來搵銀當然唔好,但盡自己所能作澄清或拜託那位朋友幫你傳遞一下啦。

      刪除
    2. 唔清楚其動機和目的,所以要澄清左先。

      刪除
  5. 抄你那些文章? 冒名? 好可恥...

    回覆刪除
    回覆
    1. 唔知有冇冒名,文章就抄了Kelly Criterion、孖膽等涉及賭波的,約六七篇。

      刪除
  6. 叫做「Poisson bet」睇黎都係賭波 ��
    Copy & paste 人地 D 有料文章扮自己有料,然後賣垃圾 tips 不過是騙徒小聰明矣。

    回覆刪除
    回覆
    1. 係,copy賭波文章為主,有冇賣tips就唔清楚了。

      刪除
    2. 就算唔係牟利,唔附上出處都好唔要得

      刪除
    3. 唔確定是否以牟利為目的,只能說動機不明。

      刪除
  7. 不能再同意更多. 小子非常不屑開班授徒之人.
    若然係贏硬, 為何教班呃人的錢比自己由市場先生手上拿的更多? (比如L SIR之流)

    回覆刪除
    回覆
    1. 就是嘛。咁簡單o既邏輯,唔明點解會有人上當「落嗒」。

      刪除
    2. 騙徒永遠是包裝一個好高回報的表象。如火尿森最近既bitcoin騙局。諗蛇既孖展買高息債。倫敦金色誘等。。

      刪除
    3. 唔怪得佢一出手就抄左池某篇90000%回報先。XD

      刪除
    4. D, 「90000% 回靸」有refer到我個名架喎!

      刪除
    5. 哈哈。冇留意佢有冇刪左你個大名添。

      刪除
  8. 如果有人自稱身家億計, silicon valley創投成功人士. 算是直線取富貴的高手了. 何以需要開班教人財自去曲線增加收入? (小弟資質差, 真係諗唔通)

    回覆刪除
    回覆
    1. 池某都諗唔通,呵呵。
      傻更更送學費比人的應該無資質可言。

      刪除
  9. 如果係本地人侵權, 應該告得入啦

    回覆刪除
    回覆
    1. 律師話封網好容易,要告到上法庭較為周折。

      刪除
  10. 池兄,想問如果dependent variable 只有頭馬同落第馬,即ordinal 0/1, 咁係咪唔洗用MLR? 用simple LR 就可以?

    回覆刪除
    回覆
    1. 是的。想做埋其他名次就要用。

      刪除
    2. 謝池兄回覆。依稀記得池兄的model 也是以頭馬和落第馬作分類,那麼為什麼還稱之為MLR?
      抱歉可能這是無關痛癢的問題,但我只想弄清基本概念。謝謝

      刪除
    3. 習慣o者,初時確是以MLR意圖一舉多得,後來主攻獨贏後稱logit model較多。

      刪除
    4. 明白了,謝!

      刪除
    5. 池某有時不太嚴謹也是事實。:)

      刪除
    6. 統計學我還在初學中, 所以還有些不太明白想請教....
      (1) 在我認知中, 賽馬只要為出賽馬, 應出現三個可能性, 勝負和.... ordinal 0/1 就可以反映嗎? 是忽略出現平頭的機會率嗎?
      (2) 賽績理論上有所謂共線性問題... 如何處理?
      小蝦米上

      刪除
    7. 1.平頭都係贏,唔係和,一場馬多過一隻W也是可以做regression的。
      2.Collinearity問題理論上不會影響整個model的可靠性,但會令個別factor變得明顯不合理,池某的做法是在data處理的階段已先確定了coefficient estimates的正負號,一發現結果相反的就刪。

      刪除
    8. /池某有時不太嚴謹也是事實。:)/

      Ha! 係我多此一問而已.

      新馬季明天開鑼, 預祝池兄及眾BLOG友馬運亨通.

      刪除
  11. 回覆
    1. 哈哈。冇咁得閒啦,新馬季開鑼,準備打仗。

      刪除
    2. 池兄咁認真,開鑼日大獲全勝乎?!

      刪除
    3. 哈哈。有頭威冇尾勢,先得後失。

      刪除
    4. 池兄中了莫雷拉x5?

      刪除
    5. 冇咁多,後面的太熱。

      刪除
  12. 全日最冷也沒一隻10倍。。不食白果已很強。。

    回覆刪除
    回覆
    1. 食白果又不至於,不過場場開熱確係好難搵到「肉」食。

      刪除
  13. 如何處理欄寛同場地狀況加入MLR

    回覆刪除
    回覆
    1. Track同going係客觀因素,無法獨立成一個factor的,要結合馬匹的檔位、負磅、跑法等主觀條件逐個試。

      刪除
    2. 插口一問
      馬匹跑法在數字上要如何表達?

      刪除
    3. 可以直接用之前的分段位置或分段時間。

      刪除
    4. 謝版主
      其實除左馬匹,騎師又有沒有辦法可以顯示習慣騎法呢?
      或者應該咁樣問,騎練除左勝率外,有沒有其他比較有用的factor?

      刪除
    5. 池某都想知有冇呀。可能有而唔知。只知道在試過的範圍內,騎師的勝率顯著有效。

      刪除
    6. 我就係發覺我個模型因為騎師勝率佔都幾大比重,搞到成日都高估晒莫潘韋呢三個人,其他factor又唔夠力fight低呢個問題 唉

      刪除
    7. Factor太少係會被雷神dominated。加多啲有效factor可以攤薄雷神效應。

      刪除
  14. 請問池兄
    新練馬師羅富全麥菲文勝率應如何處理?
    新騎師可以group埋少上陣騎師一齊當大約,但練馬師個個都有番咁上下賽績,除左那些一年才出1 2次大賽的客串練馬師(而且只有上季數據而已),group唔到,可以點做?
    請賜教

    回覆刪除
    回覆
    1. 池某是將他們同客串練馬師group埋,計埋前幾季數據唔算少。
      如果手上的數據少,池某認為group埋出賽紀錄相對較少的容天鵬等亦可行。

      刪除
    2. 謝池兄 等我搞搞先

      刪除
  15. 今晚谷戰好難玩, 全軍覆末咁滯
    不知池兄收穫如何?

    回覆刪除
    回覆
    1. 只中招多福同發明小子,拉勻全晚要輸錢。

      刪除
    2. 小弟也是只中 紅星/幸運興隆同招多福
      今晚雷神真係玩野

      刪除
    3. 潘頓都一樣玩野,開跑前佢係騎師王大熱,結果一場頭馬都冇。

      刪除
    4. 老實講 雷神做戲就真係唔夠潘頓好了
      潘頓起碼都扮野追下 雷神一唔去馬就直情直路放軟包尾收場
      btw 落飛黨勁 連魔幻神駿此等馬都計到

      刪除
    5. 估惑擺明啦
      尋晚隻八心之友都係 直路明明仲係前列 成堆馬一齊打鞭 佢就收疆
      平時以雷神作風 羸唔到都例盡力衝 佢0的戲真心唔掂

      刪除
    6. 仲要賽後獸醫檢查隻馬無異常。:(

      刪除
  16. 池兄 今勻香港馬會為表忠 在從化設訓練基地可謂捉蟲 澳洲宣布要把香港馬隔離期延長或禁止入境 雖表面原因沒太多披露 但劍指當然是此大陸基地 當年建此基地已極之懷疑且反對 理由大家心照 今次澳洲如此做法 無可厚非 事關人家育馬乃當地三大工業之一 當年探親過關都十分嚴格 說句難聽點D馬帶左病毒或傳染病入去 真係喊到無謂 而擺明就係5信呢個基地會有高度設防同水準 想深點日後都會影響到香港賽馬 單單舟車勞頓已經是問題之一 何況而家馬會好多時都不肯開誠布公
    .

    回覆刪除
    回覆
    1. 對馬會來說,除非投注額大跌,其他問題都不是問題。

      刪除
    2. 同意池兄所說, 少了一個澳洲, 充其量搞唔成國際賽或其他邀請賽, 只要馬會仲有得開賭, 就總會有人想賭, 除非澳洲新馬唔比進口,咁就大件事了.
      再講,馬會不嬲都想北望神州開拓市場,耐何內地不能賭馬合法化,所以小弟帶想馬會借此製造既定事實, 謀求將來內地開放賭馬的時候佔了頭啖湯, 甚至可能將來有部份賽事移師在從化舉行亦話唔埋, 到時FACTOR又多了一個場要分析了

      刪除
    3. 唔止未來,而家大陸人賭香港馬投注額都非常大,當然佢地唔會幫趁馬會。有左從化呢個項目,一來,大陸媒體成日報,對馬會係合法而低本的宣傳;二來,同大陸捆綁了利益,大陸應該識做勤力啲掃下外圍卦。

      刪除
  17. 池兄,中秋節快樂!
    最近很忙嗎?願一切安好。

    回覆刪除
    回覆
    1. 多謝。也祝兄台節日快樂。
      是的,最近相當忙,又重新執過個賭馬model。

      刪除
  18. 小弟已經找到”計得精彩”中文pdf版...未知可否分享給大家?

    回覆刪除
    回覆
    1. 有需要的私下聯繫兄台「傳閱」好了,成本post出來恐有版權爭議呢。

      刪除
    2. Interested to share and read. How to contact?

      刪除
  19. Model改動太多會唔會唔係咁好?


    小馬迷

    回覆刪除
    回覆
    1. 係有呢個問題,暫時仲係新不如舊,tune到人都暈。

      刪除
    2. 今季似乎啡綠格最後令彩池的整體變動更明顯。人手下注似乎已無法捕捉實際有利的馬。。。原本可買的都變了蝕本。如2場最終是否只有3號有利?

      刪除
  20. 池兄今晚又豐收了!

    回覆刪除
    回覆
    1. 一般啦,只中到可愛寶、大運起同首映。

      刪除
  21. 你好
    想問問如果不計合成參數在內, 池兄你的模型大概有多少個獨立的有效參數?

    另外不知為什麼上場名次和近幾仗平均名次這2項, 單一test明明有很高有效性,
    但一放到模型就撞到七彩, 無論點合成都唔掂, 池兄能否幫忙給點頭緒點搞?

    回覆刪除
    回覆
    1. 合成問題。合成是難免的,一般的原則某個變數與某種條件合成,而避免兩個變數合成。

      名次問題。上場名次和近仗平均名次其實是部份重複了,如果有些馬只跑過一次,上場名次和近仗平均名次更是同一個數據。

      有效問題。統計有效與實際有效不是同一個概念,開鑼時池某曾加到70幾個factor,全部統計指標靚絕,都是p-value小於0.05,屬於統計有效,但連續幾個賽日輸錢,要大幅刪掉假有效、弱有效的factor才回複贏錢。

      刪除
    2. 其他部份大約明白 謝池兄 總之就試到頭痛

      講得不清楚令你誤會了, 其實是上場名次和近仗平均名次無論是一齊或是分開放落模型, 都是不行, 總之扯到有關名次的參數就不行,
      (ps我是放用馬匹勝率和三甲率到模型, 不知是否有影響)
      因我好像記得benter說過名次很重要, 所以很煩惱.

      刪除
    3. 名次應該是一個很「強大」的factor,很容易做到有效,當然,加入完成時間等factor後,名次的效果是會減弱的。

      刪除
    4. 插口一問
      "一般的原則某個變數與某種條件合成,而避免兩個變數合成"
      想來想去某種條件不外乎路程,班次,檔位等, 版主可否提示多幾個?
      如果幾個參數分別跟同一條件合成, 成效又會否打折扣呢?

      刪除
    5. 不錯,就是班次、路程、場地、跑道等無法獨自成為參數的客觀條件。
      幾個變數跟同一條件合成問題不大,一個變數跟幾個條件合成就肯定會打折扣。

      刪除
    6. 請教池兄, 如果一個factor可以推高Alpha但都未必可以判斷佢是否有假有效,咁會唔會有另外一d比較可靠既指標去判斷是否假有效?

      刪除
    7. 任何統計有效的factor都可以推高alpha。池某沒看到過有這方面的判別指標,正在摸索解決之法。

      刪除
  22. 你好池兄
    路過爬文睇到樓上問參數問題,你上面話唔係一定p-value靚就有用,言下之意你的模型是否有包括p大過0.05的參數呢?
    仲有如果一個參數獨立時已沒什麼效,有冇可能跟某條件合成後突然變得有效?
    因為如果本身無效合左都無效就唔駛浪費時間去合

    回覆刪除
    回覆
    1. 1.p-value細過0.05代表有統計意義但不一定有現實意義,p-value大過0.05就連統計意義也沒有了,所以池某的模型是所有參數p-value都細過0.05的。
      2.有可能。比如馬匹的號數,本來不是強有效的參數,但加上「平磅賽」這個條件,就很有效。

      刪除
    2. 明白晒
      果然是真知灼見

      刪除
    3. 池兄:

      真不是想做伸手黨,但是想了45分鐘再google埋都諗唔通,點解平磅+號數會係很有效?

      刪除
    4. // 馬匹的號數,本來不是強有效的參數,但加上「平磅賽」這個條件,就很有效。

      怎樣把這類factor放入model? 如加一個"平磅賽馬號",不是平磅賽的數值set做乜?還是其他方法?
      謝謝

      刪除
  23. 想請問池兄如遇到國際賽,班次呢欄點樣處理?

    小馬迷

    回覆刪除
    回覆
    1. 同級際賽一樣o者,自己作一個就ok了,最重要的是同類賽事的表示一定要保持一致。

      刪除
    2. 明白晒,多謝賜教!

      刪除
  24. 請問池兄

    1.是不是變數一定不能同變數合成? 原因何在及有例外的例子嗎?
    2.一般來說頭馬距離參數有沒有很大效用? 如有,用整場頭馬距離還是分段頭馬距離效果好?
    3.同上, 如有, 會不會跟時間或名次參數有衝突?
    4.如果模型有一定規模, 做到中途突然要加新參數, 但因為以前的數據己找不回, 例如2008年馬會才有出分段時間, 那麼之前場次會成為缺失參數, 越做越多時一定會出現此問題, 池兄會如何處理?

    回覆刪除
    回覆
    1. 1.不是一定不能,只是一般不會這樣做,如果兩個變數都分別有效,當然是拆成兩個factor更好了。有些因果關係很明顯的變數是可以合成的,例如休息日數和體重變化。
      2.呢條答唔到,池某冇試過呢個參數。
      3.同上。但可以確定名次與完成時間是有些衝突的。
      4.池某只用近幾季的數據,沒遇到這樣的問題。

      刪除
    2. 1. "但可以確定名次與完成時間是有些衝突的" 如果遇上這種情況,兩者揀一個比較有效的使用??如果兩個同一性質参數放入model,會出現一正一負的情況。
      2. 池兄你的factor會唔會加工一番先放入model,例如負磅(如果唔做d手腳,例如TAKE LOG等) 放入model 根本無效. 還是我仲未分清什麼是變數,什麼是客觀條件.

      刪除
    3. 1.要所有情況試過先知,不宜未試就估結果。
      2.model人人都識砌,好壞之差正是在於data的加工處理。有的data既可以作變數也可以作條件,不必夾硬分。

      刪除
    4. 如果缺失參數不是源自馬會問題呢?
      例如, 想把馬匹過去十場的平均名次作為一個參數
      跑少過十場的如何處理呢?
      如只跑了兩場皆WIN, 平均名次就是1, 應如何避免?

      刪除
    5. 跑過多少場就平均多少場沒有問題呀。

      刪除
    6. A跑了一場W, 100% W
      B跑了十場有九場W, 90% W
      B比A好不是比較有說服力嗎?

      刪除
    7. 人的思維很容易困於細sample size的special case,想像不到大sample size下general case的分佈趨勢。撇開主觀判斷把各種處理方法都放到model裡run下再比較下結果是最好的做法。

      刪除
    8. 之前你提到會把少賽事的騎師/練馬師group埋一齊處理
      這不也是因sample size太小才這樣處理嗎?
      跟馬跑多少場為什麼可以有不同的處理方法?
      唔好意思, 問題多多=P
      書到用時方恨少, 對統計學的認識只有A Level Applied Math 程度, 仲要一早比返晒亞SIR:)

      刪除
    9. 一樣呀,group埋一齊係為左整大sample size;將馬平均亦是同樣目的,否則一匹馬跑了十場有九場W的sample size有幾大?

      刪除
    10. 你的意思是參賽次數少的馬也要group埋處理???

      刪除
    11. 是指某種條件下sample size細的馬。參賽次數少不代表sample size細呢。

      刪除
  25. 想問下池兄,開季至今成績怎樣,新模型有提高了準確度嗎?

    老賭徒得池兄啟蒙,由什麼都無到現在的自動下注,全由一人包辦,差不多用了2年時間,現時成績只是一般。如再要提升準確度已感覺是十分困難,現時狀況只是「不輸」,未能達至「必贏」,更何來如顧教授般用程式賭馬致富(我的最終期望)。現借此地綜合一下經驗,提醒一下後來者,必須作出充份心理準備:
    1) 老賭徒不是讀數學出身,對統計學只有預科程度,花了不少時間學習基本功。加上不識編寫程式,需要時間學習基本程式編寫及Excel函數應用,如Excel VBA、iMarco等
    2) 如對賭馬沒有興趣的你,更不應開始。如未能達至最終期望,你只得「雙失」,如只為了學術研究可另計。
    3) …. 待續

    回覆刪除
    回覆
    1. 池某今季仲輸緊錢呀。:(
      暑假時改錯了一些東西,開鑼後一直輸。忙碌到上星期才好轉過來,未追回損失。

      刪除
    2. 池兄,加油呀!

      刪除
    3. 加油呀,池兄。希望不要介意在此發文,真正目的是「拋磚引玉」希望池兄或其他師兄指正,從而得到改善。

      刪除
    4. 怎會介意呢,歡迎分享心得,一同腦震盪。

      刪除
    5. 首先多謝池兄既文章令我思考多好多野,今晚用左池兄以前既外國同香港賠率既錯價理論黎賭,確實收獲豐富,唔知池兄仲有無賭外國馬?依種錯價方式係未真係咁有效呢?還是我今晚真係咁好彩...

      刪除
    6. 池某反而在英國馬搵唔到著數,開太多熱門了。下午澳洲馬則有收獲。

      刪除
    7. 想請教下老賭徒, 用什麼方法進行自動下注? 能否在此分享下經驗?

      刪除
    8. 馬會應該無api會比你接通,最有可能係用寫外掛控制自已部電腦下注,以我經驗,簡單操作的話用vba都可以做到

      刪除
    9. 咁即係要下下對住部電腦? 呢度多人會咁落注法?

      刪除
    10. 3) 老賭徒現時所建立的two step MLR模型,只有三十個有效因子,由一百多組數據抽選出來,沒有合成(可能有但唔知)和馬匹操練相關的因子。正如池兄所說,收集數據不困難,問題是怎樣將數據變成有效因子。
      4) 因先天不足,沒有馬匹操練及試閘表現的數據,只期望可以建立一個有獨特偏向的模型(是否覺得有點奇怪?),而不是追求與公衆倍率相乎的,就算有師兄認為公衆倍率已可能達至完全有效。因此有部分的因子希望可以做到有針對性。例如,同樣是有效因子,不用騎師勝率,會選擇「同程同場地騎師勝率」。
      5) 現時只收集了三季數據,約2千場次。因數據所限,所有場地(沙田、跑馬地及全天候)數據均「統一」計算,以增加統計的有效性。但經驗所得,經「統一」模型計算後,已確認為有效的因子(p<0.05),並不代表在個別場地分開計算時,同樣得到有效。甚至有個別因子可能完全相反方向,這引致不確定性出現。如有足夠數據,老賭徒會選擇獨立計算。
      6) 因上述的不確定性,會出現不同場地有不同的準確度。老賭徒現時的模型在沙田草地會發揮得比較好,跑馬地草地就最差。為解決這問題,會在計算馬匹機會率時,將在個別場地相對沒效的因子,輸入一個虛構(dummy)數值(用平均值代替),而不是使用真實的數據計算,希望可以減少其影響性,但這方法現時未有足夠証明。
      7) 待續。。。

      刪除
    11. 想問下你地MLR 模型既 調整R 係幾多?
      我暫時只可以做到 30幾 ,如果跑馬地 就更低,係得20幾

      講番自動落注既問題,因為我見老賭徒話有學vba,而iMacro 我又唔識 同唔知你既自動落注係想去到咩程度,所以我用excel vba既方向諗,就係 你先係excel 有你分析既結果 ,以後run vba,部電腦會自動打開ie(因為excel 係微軟,所以佢可以操制ie),然後根據你既投注策略係馬會個網站黎剔 (連贏位置q之類),最後你只要再對一對,就買得
      如果你係一場買好多注飛,你自已剔可能1,2分鍾,電腦做就5,6秒。

      刪除
    12. 「自動下注」是用外掛程式將最後的計算結果,直接輸入馬會投注區。如只用MLR模型投注獨贏,有沒有「自動下注」程式是沒有關系的,但如投注Q、或是孖寶半全膽,就知道重要了。遲些會分享我的方法,編寫程式不算太困難。

      刪除
    13. 回暗飛聲師兄,
      你所講的下注logic與我現用的方法差不差,不同的是我用 iMacros 配合 Chrome 使用,VBA只是做位置coding。

      現時的方法是池兄的朋友IT人兄提示的,基本上我所建立的賭馬系統均由池兄的blog文所啟發的,這是為何要在這裡發表心得的最大原因。

      刪除
    14. 在這發表的意見全是老賭徒個人經歷,正確與否需自行判斷。個人只是非常享受從冇到有的老感覺,才發表一下,如有不對,務必指正。

      7) 在開始初期,用Excel收集往績數據個人認為是最簡單而實用的,但到後期維護時,你會發現檔案太大及太慢了,並會嚴重影響工作效率,但如有額外資源,可考慮使用Database解決這情況。

      8) 收集數據必須要懂得編寫程式,如VBA,直接在馬會或相關賽馬網站下載往績,用程式整理數據,這才可以持續及事半功倍。Excel 函數應用也是非常重要,怎樣在超過三萬條記錄中尋找同馬匹上一次或平均的數據,或同場同程同... 的記錄就要靠Excel 函數了,用VBA編程當然也可以,但剎雞豈用牛刀!

      9) 總括來說,對Excel + VBA + 統計軟件、如SPSS,SAS、的基本認識是必須的。老賭徒是用MiniTab去建立模型的。

      10) 個人認為建立一個合適而有優勢的模型是最困難的,要花大量時間及精力。老賭徒的經歷就是砌完又拆,拆完又砌,不斷重複、重複又重複,誇張一點可能到死也在修改中。在這階段完全沒有心得可言,只知道一個事實,就是你可能花一星期時間整理一個因子的數據,放入統計軟件運作後,結果可能是完全冇效,這時候的你會比死更難受。所以在任何天馬行空的想法前,必須慎重考慮。

      11) 記得池兄有個 blog友 (PP) ,曾經留言指出最後4百與最後2百加速變化是個極有用的因子,奈何要自已睇重播自行計時,相信PP兄肯定用了不少時間才有這樣的結論。由想法變成有效因子,真是要相當能力及決心,才可以去到這境界。

      12) 好了!有了計算機會率的MLR模型,無論好壞,均可操作,最壞的情況只是不如所願,沒有什麼大不了,可放膽試試。下會會分享一下投注分配系統、Kelly Criterion的應用實況,究竟位置(Pla)及位置連贏(PQ)是否可以使用Kelly分配注項?

      13) 待續。。。

      刪除
    15. Yes, surprised my ideas on last 400 or last 200 sectional speeds are remember by brilliant bloggers here. I like these last 400 and last 200 sectional speed factors as this is something not so obvious.

      What I found after races of first 2 months, pace is a very critical factor, especially for Happy Valley < =1650m.

      Tests so far can hit the winner within my first 2-3 choices in most of the races if my estimate the pace quite right. So, these few months I focusing on building up model to predict the probable pace for races.

      The coming wed will be dirt race day and this is a good chance for big profit as so inefficient for dirt races! Good luck for tomorrow

      刪除
    16. 13)建立及優化模型是漫長的作戰,擁有合適而有優勢的模型只是我的投注系統的一部份,所以老賭徒選擇將整個系統完成後才開展模型的無限looping。

      14)我可以肯定池兄對Kelly Criterion的認識算是一等一高手,閱讀他的文章你可以由淺入深的了解Kelly公式的理論及應用,可惜的是公式始終是公式,只是一個輔助工具,沒有MLR模型或其他選擇系統的指示,再神的神器也冇用,絕不能用來單打獨鬥的。

      15)首先,用MLR模型賭馬的遊戲規則是長期地「買着數」,不是投注機會率最大的馬匹,正因為這樣,Kelly公式就是最佳的幫手,理論上可平衡注碼而得到最大的增長。

      16)在建立系統的初期,老賭徒是以「計得精彩」一書所贈送的Kelly 程式作藍本修改而成。主要是採用Excel Solver計算,在單獨使用時運算約2-3秒便可得出結果,以為就是這麼簡單。當按實際需要增加倍率、馬匹資料連結時,運算時間遠遠超出想象,超過2分鐘仍未得出結果,2分鐘後的賽馬倍率已不知是什麼世界了,根本不可能用於實戰中。

      17)個人認為「計得精彩」的確是一本很好的工具書,但只能提供入門資料,絕不相信作者所說,相關程式是賭馬集團用於實戰的。老某明白到世上不可能有這樣的「着數」,小小付出就可以擁有「九陰賭經」,難矣。

      18)為解決運算問題,遍尋各方網站資料,所提供的方法只能稍有改善。正當要做「伸手黨」時,池兄與其他Blog友熱鬧地討論Kelly公式的「得與失」,就在這時MacauPro師兄貼文,提供Multi-Kelly的編寫步驟。嘩,連忙感恩及多謝!老賭徒不用半天完成,並改良多個版本使用至今。

      19)老賭徒沒有能力評論Kelly 公式的「得與失」,老某只是一個用家,由Kelly協助去分配注碼是極大的方便及益處,免卻個人感情而做錯。MacauPro 兄所提供的Multi-Kelly只適用於Mutually Exclusive (只有一個勝出組合) 的賭項,如獨贏及連贏。


      20)老賭徒一直認為位置連贏(PQ)是inefficient market,PQ彩池仍未完全達至理性,亦是日後攻擊目標,所以Kelly公式有效與否是非常重要的。為了解決這問題,花了不少時間在外國賭博和學術網站尋找答案,收集了不少資訊,但可惜的是直到今天仍然未有完整答案,一是太複雜計算及學術性令老某不明所為,或是太簡單沒法跟進。有興趣可以看看以下網站資料:
      https://math.stackexchange.com/questions/662104/kelly-criterion-with-more-than-two-outcomes?noredirect=1&lq=1

      21)老賭徒曾經用以下Kelly方式,測試/實戰投注位置連贏,全部方法均是未如理想:
      a) 修正Multi-Kelly部份參數,以此分配注碼,
      b) 假設注項為獨立場次,用Simultaneous Kelly分配注碼,
      c) 以Simultaneous Kelly為主力投注有edge注項,Multi-Kelly為副投注由程式建議的冇edge注項。

      22)上述方法(a) 及(c) 在相同情況下,收錢率會高過方法(b) ,但實際情況是中了還要輸錢,彩金未能對沖失去的注碼,要中兩注或全中才有贏錢機會,個人認為over bet 及注碼太分散是主要原因,這兩方法確實沒有成功的機會。方法(b) 是3個方案中較佳的(池兄也有建議此方法) ,雖然收錢率會差少少,好處是投注注項較少,所以損失也較小的。當然輸錢的主要原因是模型的準確度有偏差,加上Kelly對倍率優勢不顯著的注項,注碼分配相對較少,就算勝出也只可收回1/3的成本,但相同情況下用Multi-Kelly投注Q或Win則可以收回成本,這樣長賭唔輸就怪。

      23)老賭徒最初認為PQ彩池是最有利可圖的,但似乎又不如所想,是Kelly問題還是模型的本質問題? 暫時還不清楚。 現時老某用Harville/Benter correction 用0.8推算第二名、0.65推算第三名的,可能問題出自推算本身。老賭徒認為這難題在短期內肯定解決不了,所以只有放下,留待時機出現。現專心向獨贏彩池進發,希望另創佳績。

      24)老賭徒能力有限,有現時的成果已是心滿了,比較過往三十多年,年年進貢,已是很大進步。希望池兄及各方師兄繼續努力,証明LR模型仍然有利可圖。最後,下次會分享一下半自動下注編寫步驟,希望幫到大家。

      刪除
    17. 老賭徒兄,
      Benter correction 中 0.8 及 0.65 不是指第二名及第三名的機率啊!

      刪除
    18. 回HKWB1010師兄:
      可能我表達得不好,0.8 & 0.65 的確不是機率,是用來修正Harville Formula 的系數。其實,不同學者對Ordering Probabilities有不同意見及修正方法,如 Henery(1981), Stern(1990) , Victor Lo(2007)等等。學者們所討論的對我來說太不可思議,完全唔明。老賭徒只是一名初級用家之流。

      刪除
    19. 25) 老賭徒的賭馬系統工程,建立「落注」系統是最後的步驟。然而「半自動下注」程式是不可缺少的部份(當然如擁有IT人師兄的自動下注程式更為完美),否則在入閘「紅燈」亮起後,你肯定會「騰騰震」地落錯注。現分享一下老某的編寫步驟,希望對大家有所啟發:

      https://betting4hope.blogspot.hk/2017/11/blog-post_4.html

      26) 在建立系統的過程中,總結了過往三十多年輸錢的主要原因,就是離不開一個「懶」字,在過去未有系統地分析馬匹的真正實力,只聽「專家」意見及相信表面資訊,確信一隻有10倍馬就是半冷,2-3倍馬就是熱門,從來沒考慮值搏率。過往「喜冷惡熱」的老某,可能用100元只換來30元的值搏率。有了MLR模型的幫助,可以比較準確的判斷那些是「真冷門」令老某節省不少注碼。

      如要在馬場獲利,少一點能力都不行,要不斷自強才有成功機會,老某深信有幾多能力就有幾多結果。最後,再一次感謝池兄及各師兄無私的分享。

      刪除
  26. 池兄,你好。
    這三幾個月,我都在學習統計學理論,目的是可以做出自己的模型,現在大慨對迴歸技術有大方向的慨念了,但還沒有進入落手做模型階段。
    有一些初級問題還是要請教的。在我角度,眾多影響賽馬因素中,只有檔位具獨立性。假設無其他因素影響賽果,只有檔位,池兄的做法是將
    (1) 谷1000A欄1檔,谷1000A欄2檔...谷1000A欄12檔,谷1000B欄1檔.....
    這樣逐個『名目』做分析,
    還是(2) 用每個檔位的勝率,直接用數字去做迴歸?

    回覆刪除
    回覆
    1. (1)+(2),但沒分得這麼細。

      刪除
    2. 但田1400A欄14檔,跟田1400B+2欄14檔,顯然而見是兩個世界,難道池兄都歸納在是田1400-14檔嗎?
      小蝦米上

      刪除
    3. 不是的。路程和欄都有。

      刪除
    4. "路程和欄都有" 唔係好明.
      如果要細分到[埸地]+[欄]+[檔位] (例如田1400A欄14檔的勝率,田1400B+2欄14檔的勝率), 每個都分拆出黎計算,單係三年的記錄個sample size唔會夠大

      刪除
    5. 要跳出data mining的陷阱,不要「一次過」加太多條件到同一個factor,雖然這樣很容易做到統計有效,但有些條件的sample size太細危害會很大,若以後賽事不常出現同樣的條件,也談不上有什麼預測作用。

      刪除
    6. 池兄在最初建構模型時,係一開始把想得到的factor放在一起做regression再除去p>0.05的,還是one by one 逐個慢慢加入?因為不同的factor在一齊時會互相影響同一齊時放在一齊和分散逐個試效果不一樣,就好似幾舊磁石放埋一齊.
      小飛俠

      刪除
    7. 一次過放晒入model,p>0.05也保留,然後慢慢tune,tune極都>0.05才刪掉。

      刪除
    8. 如果<0.05 但正負方向唔啱會唔會保留?

      刪除
    9. 方向錯的即刪,不需要猶豫。

      刪除
    10. 意味全部迴歸係數要方向一致?

      刪除
    11. 視乎怎樣處理data,可以處理到方向一致,也可以處理到不一致,但哪個應該是正哪個應該是負一定要心裡很清楚。

      刪除
  27. 回暗飛聲師兄
    據我了解,MLR模型R-square數值高低參考性不大,不同軟件有不同數值,加上高R-square值不代表模型與數據有高的一致性,我用的軟件(MiniTab)就連R2都不提供,因她認為無用及會誤導。我只用GOF test去判斷,如Pearson

    回覆刪除
    回覆
    1. 原來係咁,因為我無統計學底,所以我既做法都係將數據放入spss 入面run,咁得出既pearson會唔會同其他軟件都有唔同呢?
      我一直以為R-square 係代表我既數據(自變數)解釋到幾多成既賽果(因變數)

      刪除
  28. 鯉魚兄,好耐無新文章噢,點解嘅?係咪搬咗地方?

    回覆刪除
    回覆
    1. 1.忙於tune model。
      2.發生抄襲事件後,對寫純理論或技術的文章意欲大減。
      3.郵箱不斷被伸手黨轟炸,問題很重複,要求很無理,已由不想覆電郵到不想看電郵,更不想再寫賭波類文章。

      刪除
    2. 呵呵,公開做電郵啊,哈哈,伸手黨,純粹傾下計或者交個朋友就算啦,命裡有時終須有...以為你搬咗添,雖然你寫嘅嘢我好多都睇唔明,不過我覺得我花時間,應該會明小小,不過忙工作,忙小孩,...知道呢個世界乜都有門路,讓自己自己快樂快樂這才叫做意義,呵呵,周杰倫,我估計我應該打死一世工,未必不是壞事,各有各門路,平淡安穩才是快樂,如果搬咗記得講我聽哦,我追你啲文章好似讀大學追網劇一樣...周麗淇,陳曉東,方力申,李彩樺,果部叫乜啊,唔記得咗,主題曲“劃火柴”...

      刪除
  29. 池兄,你好
    如果找到一些combo有效(如何良初戴眼罩馬跑谷草1650特佳), 怎樣轉為feature?
    加一個categorial variable (如果何良初戴眼罩馬跑谷草1650 = 1, 否則=0)?
    謝謝

    回覆刪除
    回覆
    1. 這樣做是可以的,但是否有效要試過先知。如樓上「小飛俠」那條問題一樣,如果這個複合條件下的sample size太細,未必是一個好factor。

      刪除
    2. 如不加categorical variable 又應怎樣做呢?

      刪除
    3. 加categorical variable並無不妥。

      刪除
  30. 請教池兄

    1.基於很多時明明計到好馬, 但個騎師今日擺明不去馬, 咁就白輸, 有時一開就知哪個騎師會搏, 但模型上沒有指明, 這人為問題可以如何在賽馬當日放到模型中顯示?

    2.另想問benter用來計三甲那3個constant, 他說是會變動的, 請問不同sample size那3個constant如何計算?

    3.池兄的模型相信也是計WIN為主的, WIN模型大抵是計第一, 模型有時出現幾隻差不多機率的, 就算其中一隻跑WIN, 另外幾隻高機率也不保證能跑二三, 買Q時應該如何考慮呢? 池兄是否用benter那個類似harville的方法, 還是另有高見?

    回覆刪除
    回覆
    1. 1.呢個問題池某都想知,有冇人可以在賽前話比池某知邊個騎師會去馬邊個騎師會唔去馬?
      2.那好像是根據regression得出的結果,所以不同的sample會有些差別,池某沒有著意研究過,記得看過一些文章,指差別不會很大,一般就是0.8和0.81的差別之類。
      3.池某現在很少買Q,有試過用harville和類似harville的方法,回報率比起Win大打折扣。

      刪除
    2. 如果加個新參數是近幾仗贏過就mark,在比賽當日邊個騎練贏逐場update,照池兄看是否可行之法?
      本人也是無論是用harville/benter correction, 效果都真的不太行
      問多個問題,池兄買獨贏會否順手補注位置?

      刪除
    3. 1.要試過先知,唔敢憑直覺亂估,統計結果通常會證明「直覺」是錯的。
      2.池某試過直接用W的edge以simultaneous Kelly買P,效果很好。但這不是一個贏大錢的方法,只能當作W注碼的一個保險,連場搏殺失手時可大幅減少損失。

      刪除
    4. 什麼是simultaneous Kelly?

      刪除
    5. 即係同時計算多個獨立選項的Kelly,類似呢個:
      http://poolshunter.blogspot.hk/2015/09/blog-post_20.html

      刪除
    6. "直接用W的edge以simultaneous Kelly買P"是什麼意思?平用理會P賠率??

      刪除
    7. 係。
      提醒:這不是傳統賭P的方法,只是作為W的保險。

      刪除
  31. 池師兄您好:

    與本文無太大關係,但係請問你知道海外賽馬賽事(S1/S2)既獨贏XML file在那個link嗎?
    本地的是http://bet.hkjc.com/racing/getXML.aspx?type=win&date=01-11-2017&venue=ST&raceno=1,但是海外的我真的找不到。

    萬分感激。

    回覆刪除
    回覆
    1. 將ST改作S1就得,同時要改返當日日期,開飛之後就可更新賠率。

      刪除
    2. 其實唔使加日期都得,使用時會更方便。

      刪除
    3. 係。平時賭即日日期同場地都可以唔加,不過同時有本地同海外賽事就最好加返,保證唔會搞錯。

      刪除
    4. 感謝老兄和池兄的回覆。

      再想請教你們一下,那個XML的更新速率是多快呢?一定是每五分鐘一次嗎?

      刪除
    5. 把 xml 放入 excel 每l秒 loop l次就知道更新頻率啦!

      刪除
  32. 池師兄:

    近幾晚花咗差唔多每晚5小時刨左9成呢個網嘅文,學到唔小野。真係要多謝師兄無私嘅分享。
    我睇到池師兄不斷提到“計得精彩”呢本書,我呢兩日亦都搵左好多間書局,奈何佢真係已經絕左版。
    想問池師兄,你手頭上有冇一本可以分享/出讓?或者pdf版你哋都提過,我真係搵唔倒link,師兄您方便share嗎?

    回覆刪除
    回覆
    1. 那是十多年前的入門書,現在池某手上真的沒有。樓上有blog友說有pdf版可share,請自行聯繫。

      刪除
    2. 如果想要實體書,中央圖書館有一本,不過係參考書,無得外借,本書唔厚,一日可以睇晒
      其實本書講MLR既篇幅好短,無講理論,直入應用,反而其他理論都幾有趣,可以睇下

      刪除
    3. Actually, 計得精彩 has English Version by the original author and it is available in Amazon under author of CX Wong. Although the grammar has been complained by the foreign readers quite a bit, it is also good reference if you want to have one copy as Chinese version I think is out of stock or only available on pdf.

      You may also search some horse handicapping books in Amazon which give you a lot of non-statistical knowledge which will help you to select what kinds of data are important for your handicapping model.

      刪除
  33. 池兄 小弟不才想問一個很低能的新手問題
    如果database要加入時間參數, 假設剛跑完的場次是第100場, 請問database記錄的時間應該是這個第100場剛跑完的時間, 還是應該放之前做了用來預測第100場時的時間? 直接點就是database應該放真實果場跑完的數據還是放用來預測該場的數據?

    回覆刪除
    回覆
    1. database可以有好多個,作唔同用途。一般的做法係由database搵出有效的參數,再用這些參數來計算下一場。

      刪除
  34. 池兄:

    馬會海外s1參考賠率有無xml link的?定係如果要輸入都要靠人手?

    回覆刪除
    回覆
    1. 有XML。在樓上答過了。

      刪除
    2. 樓上答的是香港馬會即時賠率,但是馬會也會提供海外參考賠率,請問那個有冇xml?

      刪除
    3. 呀!SORRY,睇錯。參考賠率好像沒有XML,亦不需要,因為是不會變動的,COPY下來就可以用。

      刪除
  35. 突然諗起池兄拎 10 萬做本金,池兄多唔多食回扣?

    回覆刪除
    回覆
    1. 池某將KELLY比例SET到好細,整體注碼唔大。

      刪除
    2. 最近煩緊有回扣果陣 Kelly 點玩好 ��

      PLA QPL Kelly 都唔算難,畢竟係一次計算當中,Expectation 係固定的,只係寫 Kelly 果陣做多變量微積分辛苦少少。

      但如果考慮埋回扣的話,Bet 與 Expectation 有互動,件事即時複雜左一大截。

      刪除
    3. 最難係同一場有些注碼有回扣而有些注碼沒有回扣,要做到自動調節非常複雜,一諗就頭暈。

      刪除
    4. 以馬會官方講法,似乎有冇回扣係逐條飛咁計,而唔係按注碼計。

      即係例如同一條飛入面,你買︰
      1) 6 號 WIN $7000
      2) 7 號 PLA $4500
      3) 8 號 PLA $2500

      若果只有 8 號中左,另外兩注加埋就輸左 $11000,你會袋返 8 號對應的彩金,另加回扣 $1100。
      但若果只有 7 號中左,咁另外兩注加埋只輸 $9500,唔過萬,所以你只有 7 號彩金,冇回扣。
      如果俾我人手調節,其實我會考慮增加少許 6 號同 8 號投注,令到只有 7 號跑出果陣可以食回扣。
      不過問題係我要先知道 1) 呢 $500 抵唔抵加,同埋 2) 如果要加,要如何分配俾 6 號同 8 號。

      件事真係會因為咁而複雜左好多,完全諗唔到係邊度入手好。
      最慘係想搵相關 Paper 都冇...

      刪除
    5. Sorry 打錯數字。上面應該係「若果只有 8 號中左,另外兩注加埋就輸左 $11500,你會袋返 8 號對應的彩金,另加回扣 $1150。」

      刪除
    6. 冇錯,係逐張飛計。要解決埋落注時點樣將一啲注項group埋先得,係一條世紀難題。

      刪除
    7. 問題 1), 2), 3) group 唔到落一條飛喎 ...
      1) 6 號 WIN $7000
      2) 7 號 PLA $4500
      3) 8 號 PLA $2500

      路人甲

      刪除
    8. 假設係:
      1) 6 號 WIN $8000
      2) 7 號 WIN $5000
      3) 8 號 WIN $6000
      4) 9 號 WIN $3000
      咁點都只能 group 到一條飛, 其餘散買:
      a) 6+8 Win $6000, 6 Win $2000, 7 Win $5000, 9 Win $3000
      b) 6+7+8+9 Win $3000, 6 Win $5000, 7 Win $2000, 8 Win $3000
      睇黎 a) 好少少, 唔跑 6,8 就有回扣; b) 跑 6,7,8,9 都冇回扣

      路人甲

      刪除
    9. 噢,網上投注的話,每次你撳「傳送」都係傳送緊一條飛。反而手動劃飛我真係唔識點叫一條飛……

      刪除
    10. 即係一張彩票,逐張計。

      刪除
  36. 如用全程時間/分段時間, 要調整嗎? 還是直接用raw 時間?

    回覆刪除
    回覆
    1. 池某的做法是與標準時間比較,但不能肯定這是否一個好方法。

      刪除
    2. 馬會提供的標準時間? 但那只是好地的標準時間。其他場地狀況應如何處理呢?

      刪除
    3. 時間與場地的關係,也可以拆開各種場地處理。建議兄台落手落腳各種做法都試下,睇下邊種最fit自己的model。對個別factor的處理,別人做法未必有太大的參考價值,因為大家組合與分拆的方式都不一樣,有些情況在這個factor沒有處理,可能在另一個factor已有補救。

      刪除
    4. 其實有試過落手落腳整, 但模型的pseudo R^2 整黎整去都係得0.1x
      所以諗緊係咪有啲根本性嘅嘢諗錯左:(

      刪除
    5. Actually, you can performed adjustments on 標準時間 by considering 度地儀指數 too. Professional syndicates have made their own 標準時間/分段時間 for different tracks too. The easiest way to start is from dirt races first and also sectional time are very critical data for dirt races.

      刪除
  37. 池兄,我發現自已既跑馬地模型太過偏向放頭馬,差唔多係3比1,就算有後勁好強既馬都會飛出我既範圍,可以加入咩參數或者方法黎沖淡佢呢?我諗過好多方法都搞唔掂。

    回覆刪除
    回覆
    1. 今晚豈不發達?XD
      好多factor會互相牽制,要慢慢將互為影響的factor tune到一個較為均衡的狀態,不能讓個別factor dominated左個model。

      刪除
    2. 發唔到,因為我係買連贏位置q,海之濤係計到出黎,但拖唔中腳:(
      抽下閱文搵得仲多(中左一手咁多)
      好彩靠 財高八斗 同 話得事 先回到本, 缺點就係金滿載依d馬會入唔到範圍,
      贏既時候賺唔晒,輸既時候會炒晒(好似尾場咁)
      啱啱睇到池兄既新文章,我一向都想係傳統同系統之間搵一個平衡點,因為我覺得馬匹轉腳依d係靠系統計唔到,亦都對馬匹下一場賽事係有好大影響。希望早日成功,可以分享比大家。

      刪除
    3. 11月8日 請問你能回報多少%?

      刪除
    4. 11月8日只有微利不到3%。11月5日好D,接近80%。

      刪除
  38. 唔知你係問池兄定問我:)
    我都答埋, 11月8日如果調整一下投注策略,會有100%回報,因為我係平注賭法,係揀膽拖既策略,我一直嘗試調整。。
    當然波幅好大,有時會輸9成,有時贏1,2成。。依個就係一直困擾我既地方。。
    我反而同池兄相反,用模型,季初個排大發神威,每日都有1,2成回報,但之後就出事,所以而家仲不斷調整

    回覆刪除