積微錄: 錯的代價

2017年11月21日星期二

錯的代價

和大部份賭仔一樣，池某也是樂於贏錢，討厭輸錢的。不過在一種特別的情況下，池某並不介意輸點錢，且不希望在這種情況下贏錢。那就是在自己決策犯錯或失誤的時候。

要做成一件事是需要成本的，犯錯是難以避免的成本之一。如果錯誤的決策一開始就導致輸錢，那是值得慶幸的事，因為這是以最小的代價去發現及修正一個錯誤。相反，如果決策錯誤卻一開始就因為運氣而贏錢，問題就嚴重了，這會導致往後的時間都極難發現這個錯誤的存在，甚至積非成是，指是為非，混淆自己的判斷，以為錯的是對，對的是錯，最終要為這個錯誤付出極大的代價。

面對自己的錯誤，最容易的選擇當然是像大師們那樣視而不見、視若無睹，給自己一個無限補時，就能“證明＂自己“永不犯錯＂了。但賭馬沒有補時，連輸三幾個賽日，就不得不誠實面對，無從逃避。

上文談到暑假期間為model多加了20多個factor迎接新馬季，結果弄巧反拙，新馬季開鑼後接連輸錢。這確是有點意外，因為從所有的統計指標來看，這些factor都沒有任何問題。

惟有翻資料找原因，後來終於找到，原來單看統計指標是不夠的，p-value小於0.05的parameter，並非一定有實際意義。所選取的factor，只要能反映出取值範圍的變化趨勢，統計指標就會顯示其具有統計意義，而不會理會取值範圍的符合程度。也就是說，這樣的factor可能是對實際毫無影響的，其存在甚至可能還會毒害與其相關性高而有正面影響的factor。不過，始終找不到判別這類factor的簡單方法，只能慢慢摸索了。

比較確定的是，這樣的“有毒＂factor，較容易出現在相關性高的factor之中，故此，第一步需要做的，是“減肥排毒＂，大幅砍掉重複使用的參數，一下子就刪了20幾個factor，變到model的factor數量比“抖暑＂前還少，結果是──時輸時贏，輸多贏少。

128 則留言:

Cherry2017年11月21日晚上10:50
池兄一次大贏，已可KO幾次細輸。波馬膽同玩股票一樣，最重要看年度總回報呢～
回覆刪除
回覆
Unknown2017年11月22日凌晨12:19
池兄何不還原基本步，新舊model同時運作，相比之下，或許能知兩者的優劣。
回覆刪除
回覆
白白2017年11月22日凌晨1:02
請問池兄
如果用完成時間同標準時間比較, 假設A馬快於標準時間0.3秒就是-0.3
B馬慢0.3秒就是+0.3 , 記得池兄說過全部factor都會take log, 但log前必先要絕對值化負數, 來去離不開平方, 就算不是為了log, 而是為了加工來fit in model, 有時也少不免要平方開方之類.
問題來了, 如是者做那種加工(去了負數), 那麼A馬跟B馬都是0.3, 變得完全沒分別, 纙緝上完全是錯的, 請問池兄會如何處理?
回覆刪除
回覆
學生哥2017年11月22日中午12:25
我想池兄的意思大概是一律加個正數比佢等佢變成全部正數，例如-3 同 3可以加6比佢，等佢變成3 同 9。如此就會無論如何處理都是正數。

如有錯請指正。
回覆刪除
回覆
Leba2017年11月22日晚上8:41
池兄，有沒有試過考慮 Principle component analysis？
它可以讓你的 Data 轉化為 Orthogonal，它們的相關性應該可以大大減少。
回覆刪除
回覆
joseph leung2017年11月23日凌晨1:52
我也最怕就是:因為一個好結果, 便自以為決定正確.

但我發現原來好多人都唔明呢個道理, 特別係投資界既人.
回覆刪除
回覆
Unknown2017年11月24日上午9:59
//因為投資可以補時，一日唔吹雞完場，都可以話冇錯。
呢個就係好多人炒股輸身家的原因，成日以為未平倉就唔算輸，實際是自欺欺人的自我安慰！
回覆刪除
回覆
匿名2017年11月24日晚上8:11
池兄介不介意分享一下, 一點模型裡失敗的晨操factors, 等有心人不用浪費時間去做?
如想保密不公開也是尊重你的
謝謝
回覆刪除
回覆
匿名2017年11月25日上午9:45
"假設練馬師指示係第一隻係跑50秒，第二隻指示係跑47秒，我個人就會認為第二隻好過第一隻" 可是如何得知"練馬師指示"才是難度所在
另試閘後也有評語, 如何把評語變成數字也是大難題
回覆刪除
回覆
陌生人2017年11月25日上午10:50
晨操或試閘時間對睇馬的人一定很有用。
回覆刪除
回覆
小牛2017年11月25日下午1:48
插口一問池兄
踱步和游水其實算不算有效factors?
回覆刪除
回覆
匿名2017年11月25日下午6:08
池兄, 可唔可以分享你係如何匯入xml的willpay? excel公式係咩? 我匯入佢永遠剩係已經rounding既賠率, 同以前aspx冇分別, 冇準確到兩個小數點嗰個
回覆刪除
回覆
學生哥2017年11月26日下午2:03
有禮81倍... 不得了。池兄應該呢隻執唔少...
回覆刪除
回覆
Unknown2017年11月26日下午4:10
池兄請教下無啡綠格係咪意味住賭馬集團計唔到果隻馬？
回覆刪除
回覆
匿名2017年11月27日下午1:05
想請教一下各位高人，你哋model入面有冇地度儀指數，如有可唔可以指點下點樣transform data放入model？
回覆刪除
回覆
HM2017年11月27日下午5:59
用two step model 的兄台們, 大家alpha 同beta 的比例係幾多?
回覆刪除
回覆
上水河馬2017年11月29日下午5:39
池兄, 血腥排序有沒有聽過? Displacment都係一個嚴重影響預測的因素.
回覆刪除
回覆
匿名2017年12月2日下午4:46
11月29日慘敗無一場勝，輸6千
回覆刪除
回覆
匿名2017年12月4日凌晨1:02
不太明白如何data要raw但是factor唔可以... 請問什麼區分data同factor? factor反映causation什麼意思?
謝解答
回覆刪除
回覆
匿名2017年12月4日下午3:39
池兄，睇咗你嗰文章，小弟好佩服你好仔細同分析得好好。小弟有d嘢想池兄請教及俾意見，不能三言兩語喺呢度講曬，可否提供email或PM地址俾小弟嗎？

馬克斯。
回覆刪除
回覆
匿名2017年12月4日下午4:46
池兄，嘗試去睇簡介嗰郵件，最後冇反應，所以先喺度問池兄。
1.小弟認識Excel係一般同埋冇programming嗰背景，所以想請教池兄是否值得去交學費學VBA？要用VBA嗰目的係想方便編程序去分析波。
2.如果要去分析馬會波池，池兄有冇D工具或其他参考提供俾小弟？
3.小弟都明白用D工具冇可能贏到莊家，至少唔輸到周身傷。同埋揾餐飯食下..哈

馬克斯。
回覆刪除
回覆
白白2017年12月4日下午5:11
請問池兄
1.time since last race 這項factor, 池兄能獨立用嗎? 還是建議跟什麼合成, 我無論怎樣試也是不行(p value接近0.9 >.<)
2.benter的文章建議過'compensation for bad luck in past races'這項, 池兄知道是指什麼嗎? 或是具體能怎樣用數字表達?
3.'compensation for advantageous or disadvantageous post position in past races' 同上
回覆刪除
回覆
學生哥2017年12月6日中午12:56
今晚國際騎師賽，睇嚟4場賽事edge都會唔少... 池兄準備好彈藥今晚出手未？
回覆刪除
回覆
Unknown2017年12月10日下午5:04
頭三場都係搵錢的場次，池兄今日收穫應該唔錯。
回覆刪除
回覆
匿名2017年12月12日上午9:38
昨天向池兄發電郵請教注項分配，煩請池兄指點
回覆刪除
回覆
匿名2017年12月12日晚上7:20
池兄,

小弟已經系池兄blog 瀏覽多時，
知道池兄數學能力高，小弟不才，
現時還未學會Kelly Criterion的應用。

小弟慣於統計歸納賭博公司過往開出的盤口，
雖然費時勞力，但都略有一些成果。
規納到一些盤口有78% 至 90% 的勝算。
但賠率較低，在1.3 至1.7 的範圍。

可惜這個方法，未為我帶來贏錢，卻越輸越多。
就好似星期六晚，我搜納到 5場賽事盤口在我目標範圍。過往統計勝率於78%至85%。

由於呢排運氣不佳，剔除了2場，組了條3串1。
結果偏偏85%勝率的輸掉了，也在我的3串1當中。
5場只有1場輸，偏偏我選中。

這種情況經常發生。不斷累積統計依然保持75%以上，証明方法無錯。每次大注追數都失手，越追越多。
等待這些盤口出現已經很難，難得有幾個出現，急於追數，串Q 又偏偏選中輸的。真系好氣餒。

真系好累。
等盤搵盤-> 靚盤出現 -> 大注 -> 輸 -> 調整，發覺統計勝率方法無錯 -> 結論：自己無運 -> 再大注追 -> 再輸。無限輪迴

池兄，可否比些意見。

池底泥上
回覆刪除
回覆
匿名2017年12月13日晚上7:51
自以為找到良方,
實際勝率原來如此低,
甚至是不值投注.

過往雪球越滾越大,
根據simultaneous　Kelly,
我想我要相當長時間追數.

池兄,
我有用池兄介紹的這網頁計算.
https://www.sportsbookreview.com/picks/tools/kelly-calculator/

但請問一下, 如將這網頁轉換成excel,
有無網頁介紹?
我找了好久都沒有simultaneous Kelly的Excel .

池底泥上
回覆刪除
回覆
匿名2017年12月14日晚上10:51
想請教池兄
factor上次出賽日期, 如何應付一些未出過賽的新馬?
這種日期長短的factor, 隨便作個constant數(0日, 999日之類)好像怎樣也不太合適, 應該如何做呢?
回覆刪除
回覆
匿名2017年12月15日凌晨12:19
不明白一點
參數值會顯示越大越好或越小越好, 如果出現越小越好, 則0佔優, 反之則999佔優.
這樣不會影響其他正常日子間隔的馬嗎?
回覆刪除
回覆
匿名2017年12月15日凌晨1:26
在下真是愚鈍
池兄意思是不用理, 模型自會給答案?
回覆刪除
回覆
匿名2017年12月17日下午6:08
今日只中第3、5、8場，池兄戰果如何？

Dicky
回覆刪除
回覆
匿名2017年12月17日下午6:35
我個Model 今日有個怪現象，大部分機率都唔係大熱門，只係次熱或第三熱，所以熱門賽果反而唔中。

Dicky
回覆刪除
回覆
Unknown2018年6月3日晚上7:48
原來2018年季初輸錢個果係你,留意左你好耐(在馬會的電算機上).
你的文章很有啟發性,好可惜有很多我不太明白.
我只懂一點EXCEL,想在賭博上找一點被動收入,發現是極度困難.
希望你可出一些教學啦!
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

2017年11月21日 星期二

錯的代價

128 則留言:

2017年11月21日星期二