積微錄: 賽馬冷知識

2017年4月1日星期六

賽馬冷知識

這次重砌model在2月底大致完成，參數的數量確定下來後，在過去一個多月只需作少量微調，再沒有大的改動。從2月26日至3月29日，剛好經歷了10個賽馬日，包括了日馬、夜馬、沙田、快活谷、全草地、全泥地和泥草混合，也包括了讓磅賽、平磅賽，跑過好地、好快地、好黏地，開過2倍以下的熱門，也爆過逾100倍的大冷門，算是對model作過全方位的考驗，正好檢討一下model應付不同情況的優點與不足。

賭博遊戲最令人擔心的是大幅虧損，若出現50%的虧損，須取得100%的盈利才能扳回損失，故這次選擇以一個極保守的Kelly比例進行觀察。若逐個賽日作單式計算，共有三個賽日出現虧損，幅度分別是3.5%、5.3%和5.9%，所幸的是，出現虧損的次數和幅度都比盈利低一些，七個盈利賽日的盈利率在4.7%至13.5%之間。

虧損最嚴重的是3月12日沙田賽事。見習騎師巫顯東當日以“獅子聰”和“育成寶貝”兩匹馬“起孖”，由於database裡的紀錄是巫顯東過去上陣100多次僅得1次頭馬，使model無法應付當日的巨大反差；另外，第九場重注馬“美麗寶寶”被“魅力知友”追到平頭，分去一半彩金，也使當日的收入大減。

（圖片來源：香港馬會）

另一個虧損超過5%的日子是3月22日快活谷賽事。本來當日的表現只是窄幅上落，直至第六場重注了排C跑道無敵一檔的“好益善”，看到開閘前變成“綠格”3.7倍次熱門，更是信心滿滿，不料最後三甲不入。賽後獸醫檢查證實“好益善”患有“喘鳴症”。“喘鳴症”，model裡沒有這個factor，也想不到如何設置這種極少樣本的參數。

曾經看過一套紀錄片，講述美國等地的牧場主，絞盡腦汁，以血統、遺傳工程等新舊方法相結合，以期培育出完美的純種競賽馬，在週歲拍賣會中取得天價暴利。不過，很多這些精心傑作，往往會因為一些極細微的外在瑕疵而身價大跌，欲哭無淚。

然而，馬主購買未有上陣紀錄的週歲馬，真正的風險，還不是外表能看出來的。即使拿著伯樂的《伯樂相馬經》按圖索驥，也未必能找到一匹好馬，因為現代賽馬鬥的是極速衝刺，而不需要日行千里。支持一匹體重逾千磅的馬高速奔跑，需要大量的氧氣供應，且要維持良好的血液循環機能，故真正決定一匹速度賽馬成就的，是其外表看不到的部份：心肺功能和呼吸系統。

馬匹的呼吸系統是其供氧環節的瓶頸，從而影響其競賽能力。馬不能用口呼吸，只能用鼻子呼吸，而由鼻孔至肺部的呼吸道又長又窄，鼻孔和喉嚨更是呼吸道兩個最窄的部份。有些馬匹聲帶癱瘓，鬆弛的聲帶阻塞氣管入口，呼吸道在氣流通過時發出異常聲響，就是“喘鳴”。由於“喘鳴”代表馬匹吸入的空氣大大減少，因而會令其表現大打折扣。

同樣原因，說明了為什麼馬匹在陣上流鼻血、氣管有痰、氣管有血、心律不正等內在毛病，影響會比腿部割傷、蹄鐵鬆脫等外傷和意外要大得多。

還有一個冷知識，馬匹奔跑時，是四蹄着地，其前肢與胸腔相連，使得馬匹極速奔跑時不能像人一樣自主調節呼吸，只能一步一呼吸，前蹄離地時展開胸腔吸氣，前蹄着地時呼氣，呼吸頻率受到步頻的制約，也會因氧氣的供不應求令步頻難以一直維持，故馬匹無法作長距離的極速衝刺，大多數都是狂奔二三百米就迅速轉弱。

於是，如何在不同步速的賽事中把握好發力點，把馬匹短暫的爆發力有效發揮出來，成了決定勝負的關鍵，而非必然是強者恆強，同樣的幾匹馬在不同的賽事形勢中互有勝負反而是常態。這些不確定因素，增加了賽馬運動的樂趣，也增加了賽馬博彩的刺激。

80 則留言:

賭人2017年4月1日下午4:29
每隻馬匹的體質太難量化，而且馬匹在賽日的健康情況只有局內人先知...
回覆刪除
回覆
匿名2017年4月1日晚上9:21
又長知識了。謝池兄！
池兄，哪裡可以找到砌MLR model 的入門知識呀？
回覆刪除
回覆
LCK10282017年4月2日凌晨2:08
高原訓練ｄ馬！
或者好似一戰後，俄人電運動員肌肉做ｔｒａｉｎｉｎｇ。
賽前吸定氧氣。。。打定ｄ　ｍｙｇｌｏｂｉｎ入去。。。
回覆刪除
回覆
Cherry2017年4月2日中午12:07
唔知池兄對Eddie Arcaro是否欣賞?佢哋timing真係好準...
回覆刪除
回覆
上水河馬2017年4月3日中午12:34
池兄算是新一代馬神...可否分享一下你最"鵰鑽"的FACTOR是怎樣構思和"鵰鑽"的地方?
回覆刪除
回覆
michael2017年4月3日晚上9:25
池兄事事認真！
回覆刪除
回覆
joseph leung2017年4月4日上午11:36
有沒有賽馬版的'愈跌愈有價值' 大法?
回覆刪除
回覆
匿名2017年4月4日晚上10:18
池兄事事認真！ X2

係我既數據上,巫顯東都係負數(係佢既5場W都係靠練馬師,起孖日都係留個印象俾馬主因為另一個10仔又上場)

我反而想知每個賽日本金都係一樣?
小的感到困惑
回覆刪除
回覆
匿名2017年4月8日晚上7:36
有無人高價買你個model ?
回覆刪除
回覆
匿名2017年4月9日晚上11:56
池兄會以model投注什麼彩池，因為據我所知model只能計算出W賠率，池兄會投注連蠃或位置Q嗎？
回覆刪除
回覆
無知的股民2017年4月10日上午10:53
池兄，你好！
有幸拜會你的blog，幾年前我都非常熱愛沉迷賽馬，請問你既database會否加入馬房，騎師配撘？
我有個好大的迷惑，就係獨贏彩池好難中。小弟數學不算精，感覺上都係1/12 or 1/14 ，所以經常重注 Q QP...但都係輸多贏少。如果池兄有時間可以分享下注碼分配理論就好了！

謝謝！
回覆刪除
回覆
匿名2017年4月11日晚上7:31
池兄你好！抱歉可能會有離題，但想知道一下池兄是如何篩選 model 包含的參數？
例如如果你有一些 data 是「流鼻血 = 1；沒有流鼻血 = 0」、「負磅 × 途程」、「log 賽事獎金」等，池兄會如何判斷它們應否加入 model 中？
回覆刪除
回覆
匿名2017年4月11日晚上8:05
池兄，我想問有一些時間上的數據例如路程時間及標準時間。由於涉及不同路程及班次，你會如何量化去比較馬匹的實力？
回覆刪除
回覆
匿名2017年4月23日下午4:34
池兄你好有一個問題請你賜教

1."馬匹出賽日與上仗贏馬日期相距"此參數,parameter理論上是越小越好甚至是負,對沒羸過我馬的我試過用0又試過999(代表很久遠),但出來的效果用0表示沒羸過的馬,那參數會出現負數,用999,參數就會出現正數,變相相反地高估了沒羸過的馬的能力,奇怪的是用0或999代表的參數,其p值都是少於0.05,請問出了什麼問題該如何解決?

2.池兄如有此參數,是用什麼來代表沒贏過的馬?
回覆刪除
回覆
大b2017年4月23日晚上7:03
我今天一凱理計。。共虧了近40%本金。。。只中了一場而且是買時27倍中了只剩10倍的啡格。。。你是以多少凱理可每次虧5%以內
回覆刪除
回覆
思思2017年4月26日晚上7:34
你好小女有3個問題枇請教
1-計馬的平均名次,池兄建議用多少場做平均?
2-小女追看之前的留言,池兄所有參數都會take log,想問有時全部take log會有衝突,如果有的用log,有的用square之類可以共存嗎?
3-池兄的模型裡,以同一個參數用來合成一般大約可以合到多少個有效和不會衝突的新參數?
回覆刪除
回覆
匿名2017年4月28日下午1:45
版主如何處理馬在田泥田草和谷草所獲獎金?有沒有獨立分開?
回覆刪除
回覆
匿名2017年6月3日下午5:33
池兄,請問你是用excel作為database的儲存工具嗎? 日積月累下我的excel database已經接近70mb連運算也有點難度(可能電腦需要升級),你有遇過這難題嗎? 感謝回答.
回覆刪除
回覆
HKWB10102017年8月4日上午11:15
池兄用的標準時間是用各班次場地路程的第一名時間,然後取平均數嗎?
回覆刪除
回覆
学生2017年8月5日上午11:59
请教一下池兄，你在建模的时候，会将数据标准化吗？还是直接用原始数据？
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

2017年4月1日 星期六

賽馬冷知識

80 則留言:

2017年4月1日星期六