2017年12月21日 星期四

答問大匯

承蒙各位blog友厚愛,一直踴躍與池某作各方面的對話和交流,在此先說聲感謝,同時也要說聲抱歉,對於大部份電郵和部份留言池某無法逐一答覆。

近半年來,池某的郵箱被不斷轟炸,blog友們的問題五花八門,波、馬、計數、coding、升學、揀科、轉工等等問題都有(只差感情問題沒收到過)。有的問題很重複,令人疲累;有的要求很無理,令人無奈;有的內容很空泛,無從答起;甚至有不少是直接send個excel template來叫池某debug的。對這些來信實在沒有時間和精力一一回答,然又恐辜負blog友們的信賴與期待,現在匯在一起集中回應一下較常見的問題:

1.
問:我過去的平均命中率是XX%,平均賠率是X.X倍,應該如何分配注碼?

答:一般來說,如果下一場賽事的機率可計算且賠率是確定,就可用Kelly Criterion計算注碼分配。例如,期望勝率為80%而賠率為1.5倍,注碼比例就是(1.5*0.8-1)/(1.5-1)=40%。但對於“平均”的機率和賠率,池某不贊成直接代入Kelly Criterion計算,因為下一場賽事的機率和賠率都可能會遠離平均。對於這種情形,其中一個可行做法,是每次以本金的一個固定比例(或某個比例範圍)下注,實際注碼隨本金的結餘變化增減。若這是一個有正回報的賭局,這個做法一樣可以令本金增長得很快。

2.
問:我想學賭波/賭馬,有什麼書/文章/網址介紹?

答:香港的教育問題:小學時問老師答案,中學時在書裡找答案,大學時找有答案的書。現實中社會很多事情並沒有標準答案,書/文章/網址所寫的,通常都是在某種條件下解決某個問題的思路,並非一個通解,也不會由起點到終點列出解決步驟。故此,找答案不如找問題,亦即要先有了自己的approach或想法,再看看實踐自己想法時有何問題和障礙需要克服,然後針對性地去解決。池某認為最好的書/文章/網址,就是自己本來就感興趣的、想看的書/文章/網址,自己把所學、所想的融匯貫通,比夾硬塞進一個一知半解的所謂的標準答案強得多。請參考這篇:
http://poolshunter.blogspot.hk/2016/04/blog-post_26.html

3.
問:有沒有數學、統計、精算方面的書推薦?讀pure maths好、applied maths好、還是statistics好?

答:同上。印象中當年讀數學也好,統計也好,教授和講師都有自己的講義,參考書雖列了一大堆,但從沒有教授或講師會說哪本好。至於升學問題,池某離開校園已多年,無法給出什麼有益的意見,最多只能談談自己當年讀書的感受。池某的感受是,自己的選擇自己負責,應根據自己的興趣和目標作選擇。

4.
問:可否教我賭波/賭馬?

答:這個問題太空泛。統計模型賭波/賭馬只是一種漸近或模擬的方法,並非唯一的途徑,亦未必是最好的途徑,若大家本來選擇的路徑就不同,很難言教。若大家在共同的路上先後遇到一些具體的難點或疑點,互相交流一下解決問題的心得或失敗的經驗,則未嘗不可。

5.
問:可否教我excel/vba?

答:excel/vba只是處理問題的工具,並非必需,也非不可替代。池某沒有正式學過excel/vba,絕大部份的function和command都唔識,每次都是遇到問題才去google解決之法。所以學excel/vba的最佳途徑是透過google,或去上相關的正式課程。

6.
問:孖膽盃賽的機率怎樣計?

答:又是一個沒有標準答案的問題。怎樣計只在於“方便度”和“準確度”之間的選擇而已。
一,將半場波膽賠率轉為機率,然後將下半場的機率當成上半場機率一樣。好處,“方便度”很高;壞處,“準確度”欠奉,只買前面幾注還可以,越往後偏差越大。
二,將半場賠率還原為半場“實力指數”,再以poisson計算各個半場比分的機率,然後將下半場的機率當成上半場機率一樣。好處,偏差比第一種方法小;壞處,實際上,下半場的“指數”和上半場是不一樣的,通常下半場會大小小。
三,將半場賠率還原為半場“實力指數”,將全場賠率還原為全場“實力指數”,相減就得出下半場“實力指數”。好處,理論上這種做法較合理;壞處,做起來較麻煩,而且,談到具體的回報,理論和實際總是有差距的。
四,將上述做法自由組合,調節出自己認為“方便”,且“準確度”又可接受的做法。

7.
問:怎樣用excel寫Kelly calculator?

答:資深職業賭徒macaupro兄曾在這篇文章的留言post出用excel寫multi-Kelly calculator的詳細步驟:
http://poolshunter.blogspot.hk/2017/01/blog-post.html

8.
問:可否copy一個半自動外掛給我參考?

答:唔可以。那是IT人的作品,池某非版權所有者。

9.
問:有沒有Facebook、WeChat、Whatsapp聯絡交流?

答:唔用Facebook、WeChat;Whatsapp只for親友聯繫。

10.
問:可否send你的賭波/賭馬程式和database比我參考下?

答:唔可以。

2017年12月8日 星期五

170倍回報

早前看新聞,赫然發現,多年前一宗並非以投資為目的的、小得微不足道的交易,帳面回報率竟然高得驚人。準確地說,當時買入的只是一本書,一本薄薄的小書。

據媒體報道,中共十九屆一中全會確定王滬寧晉身政治局常委之後,他於1995年出版的《政治的人生》一書被熱炒,有書店標價599元已經被搶購一空,僅剩為數不多的1500元作品,有網友戲稱這是典型的洛陽紙貴。


這本書,池某書架上有,翻到書本背後可以看到原來的定價:8.7元。也就是說,現在帳面升值了170多倍。


從這段出版資料也可看到,此書第一版的印數為15000本。其出版時池某仍在大學未畢業,是池某畢業工作幾年之後,才於大陸的書店購入,當年此書“滯銷"的情況可想而知。

現在此書忽然被熱炒,真是有點意外。如果是想了解這位政治明星的從政經歷,書裡並沒有這方面的內容。資料顯示,王滬寧是1995年離開復旦大學出任中央政策研究室政治組組長之後才參與政治的,書裡的“自序"亦寫道,此書是作者於1994年年底完成,他自己也稱,之所以起名為《政治的人生》,並非指一種政治的經歷,而是作為一名政治學的學者,人生大部分時間均用來做專業學問了。

在書裡反而可以看到很多人性化的經歷。作為日記,《政治的人生》記錄了王滬寧在復旦時的生活點滴,每篇篇幅都不長,內容很雜,有對政治、社會問題的思考,也有生活趣事,其中寫得最多的是讀書和追劇的感想。日記內容顯示,他的閱讀面甚廣,古今中外,包羅萬有,連金庸的《射雕英雄傳》等通俗讀物也不放過,且給予很高的評價。

書裡也寫到一些生活瑣事,沒有學者的嚴肅,非常幽默。比如寫到有一次“打機"玩“大富翁”,“又是買地,又是炒股,又是建築商場,最後破產,輸給一個叫‘大老千’的人,被狗追得到處逃,落到陰溝裡”。令人會心微笑。

平淡中見功力的是,他多次寫到茶餘飯後散散步或遊山玩水,總是能“得詩一首",押韻、平仄、對仗都甚是講究,“指觀世事出清淡、笑看人生入深沉"這樣的佳句俯拾皆是。可見他除了學貫中西的淵博知識之外,還有深厚的文字根底,能成為三朝“文膽",絕非偶然。

政治的人生也好,遠離政治的人生也好,人生的回報很難、也不應該用量化的數字來衡量,一個人若能找到適合的舞台,將自己的興趣和能力盡情發揮,應該就是最大的回報了。

2017年11月21日 星期二

錯的代價

和大部份賭仔一樣,池某也是樂於贏錢,討厭輸錢的。不過在一種特別的情況下,池某並不介意輸點錢,且不希望在這種情況下贏錢。那就是在自己決策犯錯或失誤的時候。

要做成一件事是需要成本的,犯錯是難以避免的成本之一。如果錯誤的決策一開始就導致輸錢,那是值得慶幸的事,因為這是以最小的代價去發現及修正一個錯誤。相反,如果決策錯誤卻一開始就因為運氣而贏錢,問題就嚴重了,這會導致往後的時間都極難發現這個錯誤的存在,甚至積非成是,指是為非,混淆自己的判斷,以為錯的是對,對的是錯,最終要為這個錯誤付出極大的代價。


面對自己的錯誤,最容易的選擇當然是像大師們那樣視而不見、視若無睹,給自己一個無限補時,就能“證明"自己“永不犯錯"了。但賭馬沒有補時,連輸三幾個賽日,就不得不誠實面對,無從逃避。

上文談到暑假期間為model多加了20多個factor迎接新馬季,結果弄巧反拙,新馬季開鑼後接連輸錢。這確是有點意外,因為從所有的統計指標來看,這些factor都沒有任何問題。

惟有翻資料找原因,後來終於找到,原來單看統計指標是不夠的,p-value小於0.05的parameter,並非一定有實際意義。所選取的factor,只要能反映出取值範圍的變化趨勢,統計指標就會顯示其具有統計意義,而不會理會取值範圍的符合程度。也就是說,這樣的factor可能是對實際毫無影響的,其存在甚至可能還會毒害與其相關性高而有正面影響的factor。不過,始終找不到判別這類factor的簡單方法,只能慢慢摸索了。

比較確定的是,這樣的“有毒"factor,較容易出現在相關性高的factor之中,故此,第一步需要做的,是“減肥排毒",大幅砍掉重複使用的參數,一下子就刪了20幾個factor,變到model的factor數量比“抖暑"前還少,結果是──時輸時贏,輸多贏少。

2017年11月7日 星期二

軟肋

暑假前有blog友留言直指池某“唔識馬",所說的是事實,一直以來池某忙於計數、砌model,反而忽略了這個遊戲的主體對象。在此要特別多謝blog友坦誠指出池某的弱點與不足。“抖暑"期間,池某找到了一位以傳統方式賭馬的高手,補強一下這個軟肋。

高手以賭WP為主,沒有使用統計模型,也沒有使用Kelly Criterion,每場只押注一匹馬,近年每個馬季都保持七位數字純利,且每季續有進步。

傳統方法與統計模型能否兼容呢?細談之下,才發現大家的計算方法和投注策略並沒有大分別。高手雖然沒有使用統計模型,但他的做法同樣是羅列了一大堆factors,然後根據累積的賽果不斷微調這些factors的比重,只是沒有經過做regression這個過程而已;另外,高手雖然沒有直接使用Kelly Criterion,投注策略的背後意念與Kelly Criterion還是非常接近,其具體做法是,先定下一個相對於本金結餘的投注比例區間,然後根據所選馬匹的機會率與賠率,在區間的上下限之內選取一個比例下注。

如果要比較大家的不同,池某覺得很像中醫與西醫的分別。高手像個老中醫,可以憑經驗根據有限的factor快速準確斷症,執藥的劑量也較靈活隨意且具針對性;池某的做法則像西醫,任何情況都要把整套程序由頭到尾走一遍,遇到特別的情形也不能變通,好處則是即使碰到複雜混亂的局面都不會增加自己的精神負擔,長期作戰亦沒什麼壓力。

統計模型明顯不及傳統方法之處,是對初出馬的估算,缺乏足夠數據之下,model對初出馬的計算完全是無能為力,傳統方法則或多或少算是有法可依。高手對此尤其擅長,他非常關注馬匹特別是質新馬的賽前部署,由馬匹抵港隔離檢疫露面出操就開始追蹤,例如今季的一出即勝的“同得福"、“電子大師"等等,都逃不過他的法眼。

但如何將傳統的決策邏輯變成可做regression的數據是一個問題,比如晨操,傳統的做法可以根據功夫是否完整、有否缺課,甚至跑姿、毛色等主觀觀感,綜合出“好或唔好"這樣的判斷結果,這些都不容易以完全客觀的數字來表達,而且馬匹的晨操還包括了試閘、快操、踱步、游泳等項目,簡直是混亂凌亂,無從下手,故晨操一直是池某的model所欠缺的一塊。

在高手的引導下總算為model補足了晨操這一塊,且在這種縱向思維的刺激下思緒如泉湧,一下子為model新增了近20個factors,以前所未有的鼎盛陣容迎接新馬季開鑼,結果是──輸錢!

下回再談。

2017年8月25日 星期五

富貴直中取

首先要聲明一下,此blog的文章雖然水平很一般,無甚可讀性,然而每一篇皆為本人原創。敝帚自珍,池某不介意別人傳播這些文章用於知識性的討論,但不能容忍被用於商業或動機不明的目的。

昨日凌晨,有好心的blog友留言告知,有人公然竊取池某的文章到其自己的網站,又在FB的賭博group作動機不明的活動。基於上述原則,已立即針對懷疑侵犯版權的網站採取法律行動。


池某不知道類似的事件會否再次發生,也不知道會否變成另一種形式出現,且在法律的死角中滋生蔓延,而令正常的法律手段鞭長莫及,惟有在這裡重申:此blog每一篇文章的版權均為池某所擁有,除其中一篇曾供《信報月刊》使用外,不曾授權其他媒體、網站、博客或FB群組使用。

同時也要在這裡聲明,池某不會在任何FB群組活動,任何在FB或其他社交媒體、群組、討論區聲稱或暗示是池某身份的,絕對不會是池某本人。若懷疑有人藉此行騙,或因此而蒙受損失,請立即報警求助。

池某始終相信,富貴只能直中取,不可曲中求。要成為市場的贏家,應不斷磨煉提升自己的能力,堂堂正正從市場贏取自己應得的部份。諸如賣tips呃錢、賣口水授徒的曲線賺錢途徑,真正有能力在市場贏到錢的人不屑為之。

2017年8月8日 星期二

開班

上月,池某悄悄地開了一個班。是的,是悄悄地開,沒有像“開班奴”大師們那樣一早就敲鑼打鼓到處賣廣告叫人把學費存入戶口。結果當然是“失敗”的,“學生”只得一個,非但賺不到錢,而且時間、精力、銀包全都大出血倒貼。一切都是由這封信開始:


大概兩個月前,收到香港數學奧林匹克協會的來信,邀請化骨龍W赴馬來西亞參加2017亞洲國際數學奧林匹克公開賽亞洲總決賽,與其他國家的參賽者較量一番。當初,是W的學校派遣並代為報名參加初賽的,初賽過關後又貪玩參加了晉級賽,取得了總決賽的參賽資格。不過,對於千里迢迢跑去馬來西亞只為計幾條數,並沒有太大的動力,但看到邀請信所附行程介紹那間美輪美奐的酒店Lexis Hibiscus Port Dickson,馬上就決定報名,當作去渡假遊樂好了。


池某並不認為這個比賽的水準很高,卻也不敢說其水準低。應該說,這是一個不難獲獎但不容易取得高名次的比賽。由於參賽者眾多,水平難免很參差,而初賽、晉級賽可過關的百分比又很高,故W這種基礎不太差的,完全不需要作任何準備,全不費勁就輕鬆連過兩關。這使W把決賽也想像得很簡單。

然而決賽的對手大不一樣,很多小國派出的參賽者不多,卻是精英中的精英;中國這樣的人口大國,更可輕鬆地組織一支龐大而受過訓練的參賽隊伍,大比例地壟斷獎項,把其他對手擠下去。W想繼續打天才波搏懵,真是異想天開。

池某特地把去年決賽的past paper找來由頭到尾做了一遍,更發現並不如W所想像那麼簡單。主要是因為試題涉及到Factorization、Circular Functions、Sequence and Series、Permutation and Combination等知識,是W在學校課程中不曾接觸過的,現在不僅要求掌握這些知識,更要懂得靈活運用,想在短期內速成,不可能。

個人榮辱事小,陀衰港隊、貽笑海外事大。池某雖然不好為人師,但作為俯首甘為孺子牛的怪獸家長,不得不做一次“開班奴”,準備了四堂課程,希望W出發前學到幾多得幾多。可是6月是學校的考試月,不能分心,一直等到7月中放暑假,才有機會上第一堂,之後W又出外遊埠,過了一個多星期才回來上第二堂,已經把第一堂的內容忘記得七七八八。上完第二堂,還來不及消化,就要出發比賽了。

比賽的過程無謂多說了,做得“開班奴”,自吹自擂是多餘,不斷找藉口是自欺欺人的。無論好醜,不管有沒有收學費,還是倒貼學費,好歹也應該晒一晒“學生”的成績吧。


2017年7月21日 星期五

學巴菲特做生意

池某養育了成竇化骨龍,算是為緩和香港人口老化問題盡了一點義務。正所謂樹大有枯枝,族大有傻豬,化骨龍們有時會帶來很多的歡樂和滿足,有時則帶來不少的煩惱與擔憂。

話說日前大考之後、放暑假之前,化骨龍WY神神秘秘相約行街shoppingW與池某比較啱傾,無所不談。池某問起他們shopping的成果,W說自己一無所獲,但透露Y40元買了一本暑期作業。

池某馬上意會到不尋常,以Y的性格,從來是玩樂大過天,功課放一邊,零用錢百分之一百只會放在吃渴玩樂,絕不可能花一分一毫於學業,連十元八塊的班會費都一定攤大雙手向老爸要,怎可能主動動用零用錢買暑期作業來做?

W繼續說,其實Y的學校早已派發了暑期作業,但老師把隨作業附送的答案抽起了,Y為了玩盡整個暑假,才特地花錢買一本“答案”來抄。

這倒很符合Y的性格,對於玩樂,就是捨得下本錢。

Y說不一定會蝕本,可能還有錢賺。”W說得興奮,已經停不來。

什麼?後面還有故事?

Y說全班同學都有這個需求,如果向每個同學收費2元就把答案whatsapp給他們,那麼只需20個同學出價,就能回本,多過20個,就有錢賺了。”原來Y之前曾經做過一個人物傳記閱讀報告功課,看過巴菲特小時候分銷可樂賺錢的故事,認為自己也可通過“分銷答案”來複製這個成功故事。W說到這裡,語氣間還流露出對Y的“生意頭腦”的羨慕與讚賞。

真是混帳!池某幾乎被氣至吐血。小巴菲特分銷可樂之所以能成功,是因為可樂是消費品,每銷出一杯,就會被消耗掉,不會被重複轉售。“分銷答案”面對的市場顯然不一樣,如果這個“市場”真是存在,那麼假設有個同學A2元買了答案,然後再以1元一個叫賣,Y就完全沒“生意”可做了;又或者有更大方的同學,將答案放上群組,整個“市場”就立即不再存在了。這是市場風險。

當然,Y可以選擇先統一收費,再統一“發貨”來控制市場風險。問題是,這本來只是天知地知WY知的事情,當晚就被家長知道了。如果這件事搞到全班同學都知道,學校老師又怎會不知道?這是政策風險。


這場鬧劇看來是要以“生意失敗”告終了。事情雖小,卻也說明了要成功做成一件小事之難。某些大師整天侃侃而談,“分享”一些獨立個案和股神或價值祖師爺的隻言片語,然後斷章取義地片面理解,又教人生搬硬套地模仿,比起小孩子做生意又高明得了多少?

2017年7月3日 星期一

孖寶半全膽

TeamKill兄在上文的留言中羅列了今季賭“孖寶半全膽”的數據,命中率很正常,盈利率也很正常,數據結果說明了“孖膽”已變成一個“雞肋”彩池。

“孖寶半全膽”這個彩池本來就有幾點先天不足:

第一,投注額很低。雖然平均比“足智彩”另一個大彩池“六寶半全場”多很多,但與即使相對不甚受馬迷歡迎的賽馬大彩池“三寶”相比,往往連十分之一也不到。過低的投注額限制了利潤。

第二,抽水率很高。25%,比起同為pari mutuel的賽馬單項彩池17.5%抽水率高出一大截,這意味著相對於公眾要有很大的優勢才可能在“孖膽”彩池取得利潤。

第三,無法製造複式效應。受遊戲規則所限,不能隨著本金的增減由每注10元變成每注11元或每注9元一注一注地買,只能每次平注結算。製造不了複式效應,就是一個不能靠之發達的彩池。實際上其過低的投注額亦很難顯現複式的效果。

集合了這麼多的缺點在一身之後,令“孖膽”多了一個其他彩池所不具備的優點──高手都不屑在這個彩池搵食。沒有高手的地方,就是一個inefficient market,就是有利可圖的地方。但是market最終會走向efficient,這是必然的。

池某初戰這個彩池時,正遇著錢多人傻的美好時光。當年馬會每天只開一口“孖膽”,投注額很有保證,總有40萬~50萬元以上,在射程範圍內的結果,一般約有30~50注中,也就是說,很容易中的組合,每注派彩也常常高達7000~8000元,甚至過萬元。

不過這種好日子維持的時間並不長,很快馬會變成每天開兩口“孖膽”,攤薄了每口的投注額,同時又開設了“半場波膽”等彩池,使原先“盲中中”的“孖膽”投注人有了大方向可依,於是“孖膽”彩池變得錢不再那麼多人不再那麼傻,常中的組合,每注派彩降至4000~5000元左右。具有優勢的model,仍可在這個彩池搵餐下午茶。

後來馬會又變成每天開三口“孖膽”。這是“孖膽”彩池變得乏味的開始,每口的投注額被攤至更低,經常不到20萬元。一口“孖膽”共有105625個組合,20萬元的投注額只能覆蓋一個極低的百分比,故結果稍有偏差就沒人中。也許這正是馬會想要的效果──以累積多寶刺激下一輪的投注。

另一個問題是在每口不到20萬元的投注額中,相似度變得很集中。從池某前面blog文的留言可看到,至少有5、6位blog友在使用與池某類似的計算方法;另外從流量來源也可查到,有人把池某的文章放到了香討,那裡應該又有幾位網友掌握了類似的算法,當然還可能有更多人已掌握了而沒表露身分的。現在,常中的組合,一般約有50~60注中,而投注額不到20萬元,令每注派彩降至2000~3000元,甚至2000元以下。在命中率大致不變的情況下,真成“雞肋”了。

“孖膽”模型是池某第一個成功在實戰中獲利的統計模型,之後動手砌賭馬模型的信心和決心,都是源於“孖膽”模型的成績。故對池某來說,“孖膽”模型的象徵意義遠比贏錢意義重要。來季,“孖膽”應會繼續賭的,但只會當玩票性質,不會每口都買,會像昨晚那樣,看到有累積或投注額足夠高才買。



2017年6月23日 星期五

Kelly Criterion的應用

上水河馬兄等blog友在上文的留言中談及Kelly Criterion的使用,特別是對於Kelly Criterion是否適用於賭馬,列舉了不同的觀點,池某覺得要三言兩語說清楚這個問題也不容易,故特別找回發表於《信報月刊》三月號那篇文章,雖然內容與池某過去的文章有部份重複,但尚算是較簡單而完整地說明了Kelly Criterion的來龍去脈、適用範圍,以及應用於不同情況要顧及的問題等等。簡而言之,池某的觀點是,不必把Kelly Criterion神化為無往而不利的賭博公式,也不必偏執地把Kelly Criterion貶為無用之物。用得其所,受用不盡;亂用一通,禍患無窮。


1956年,當時美國AT&T公司屬下的《貝爾系統技術期刊》刊發了一篇題為《對信息傳輸速率的重新詮釋》(A New Interpretation of Information Rate)的論文。60年來,論文的內容一面受到投資者、賭徒熱情追捧,一面被名家、學者無情鞭撻。儘管論文的題目早已被人遺忘,它的另一個名稱卻愈來愈廣為人知,那就是Kelly Criterion。

一篇信息學的論文,卻震動了投資界、賭博界,論文的作者John Larry Kelly應不會感到意外,本來他就將論文命名為《信息論與賭博》,只是公司高層因對形象與道德問題有所顧慮,才要求他更改標題。John Kelly這篇論文的出發點就是要計算怎樣以「不公平」的信息從「公平」的賠率中獲利,而且將利潤最大化。

Kelly Criterion,一般譯作凱利公式,其基本形態是這樣的:f=p/a–q/b
其中,f是投入資本的最佳比例,p是盈利的機會率;q是虧損的機會率,在非勝即負賭局中,就是q=1-p了;a是虧損幅度;b是淨盈利率。

一般來說,在賭博遊戲中,輸就輸掉所押賭注,故a=1;如果採用常用的賠率o代替淨盈利率b,即b+1=o,得出:
f=p–q/b=(p*b-1+p)/b=(p*(o-1)-1+p)/(o-1)=(p*o-1)/(o-1)
就是Kelly Criterion最常用於賭博的版本。

例如,以100元本金玩擲硬幣遊戲。假設每次只能押注一面,猜錯會輸掉注碼,猜中賠率為3倍。這是一個對參與者來說明顯有優勢的遊戲,但怎樣才能以最快的速度贏最多的錢呢?想一次過贏得最多,當然是全數押下去,但這樣只要輸一次就「清袋」了;想安全一些,每次押10元如何?似乎效果又很有限。John Kelly在其論文中證明了,Kelly Criterion就是可以令資金增長得最快的公式。

根據Kelly Criterion,這個賭局每次最佳的投入注碼比例為f=(0.5*3-1)/(3-1)=25%。猜中,本金變成100-25+25*3=150元,然後以150元作為新的本金,再以25%的比例下注。如此類推,資本長玩長有,永不可能是零,可以有效避免「清袋」,又能實現以最快的速度增長。理論上很完美,但是...

回到實際,即使是機會率50:50的賭局,也並非必然賭兩局就會贏一局的,連贏兩局並不奇怪,連輸兩局也不奇怪,連輸十幾局也是可能的。上述例子的賭局,只要連續五次猜錯,本金就將萎縮至100*0.75^5=23.7元;連錯十次,本金就會只剩下5.6元。理論上這並不是什麼問題,只要再經過無數次押注,最終還是能回復到理論值的結果。但在現實中這是個大問題,如果遊戲要求每注最低限額為10元,連輸九次就是實質破產,沒有翻身機會了。

由此可見,即使是有全面賠率優勢的賭局,即使概率準確無誤,使用Kelly Criterion,也是可能使人快速破產的。這是理論與現實的差距造成的,理論可以解釋到無限,現實是人類社會的活動,包括經濟活動,都是有限的。故看起來很美好、用起來很危險的Kelly Criterion一直備受咎病和質疑,經濟學泰斗Paul Samuelson就斥之為異端邪說,據說連作者John Kelly本人在其有生之年也從不曾使用Kelly Criterion贏過錢。

但Kelly Criterion由始到終都不乏支持者,包括推薦John Kelly發表這篇論文的信息學鼻祖Claude Shannon,數學家Edward Thorp更親赴賭場賭二十一點去驗證,並將其橫掃賭場的經歷寫成Beat the Dealer一書,Thorp還透露,年輕時已與他相交的股神巴菲特,也是用Kelly Criterion的思維方式來投資的。把香港馬場當作提款機的大鱷William Benter也在多個場合表示,所有成功的賭馬集團都是按某個比例的Kelly Criterion分配注碼的。

按某個比例的Kelly Criterion下注,就是成功規避「快速破產危機」的手段,例如使用0.5倍的Kelly Criterion,即每次只以半數的Kelly Criterion賭注下注,雖然回報會略為減少,卻能大大降低波動性,大幅降低破產的可能性。不過,這種為安全買保險而捨棄了增長速度的Kelly Criterion,嚴格來說已稱不上是能令資本增長最快的公式,但與其他投資策略相比較,其效果依然是最好的。

2005年,William Poundstone所著一書Fortune's Formula出版,收錄了John Kelly、Claude Shannon、Edward Thorp與Kelly Criterion發展的詳盡故事,一紙風行,使Kelly Criterion成了家傳戶曉的「財富公式」,也使無數投資者和賭徒爭相仿效,但真正能體驗到Kelly Criterion威力的人並不多。原因有二:其一,很多人只是隨大流追逐Kelly Criterion,而誤以為Kelly Criterion就是一條可以創造財富的公式;其二,不少人都「以為」自己在正確使用Kelly Criterion,實際上並不是那麼回事。

Kelly Criterion本身並不能產生財富,而是任何可盈利系統的最優加速器。例如Edward Thorp在賭場賭二十一點,贏錢的關鍵是他獨創的那套數牌技巧,甚至他後來轉戰金融市場,贏得「量化投資之父」的榮譽,靠的也是他自己所創的,比Black–Scholes model更早的期權定價公式;而William Benter賭馬能贏錢,則是靠他苦心經營的統計模型。Kelly Criterion的角色,只是「輔助」數牌技巧和統計模型把其原本優勢發揮得更有效而已。也就是說,如果使用者手上沒有一套具優勢的投資系統,Kelly Criterion也就沒有著力點了。

另一方面,人們之所以經常誤用Kelly Criterion而不自知,是因為Kelly Criterion看起來很簡單,f= (p*o-1)/(o-1),只需代入概率p和賠率o,就能計算出最優投入資本比例f,連小學生都能看明白。但現實中的賽局,很少是如上述擲硬幣的遊戲那麼單純的,例如一場馬,有14匹馬上陣,其中有些需要下注有些不需要下注;又如同一時間有10場球賽開賽,同樣其中有些需要下注有些不需下注,那麼最優的投注比例應該怎樣計算?

把問題簡化一些,當作一場有A、B、C三匹馬上陣的賽馬。假設A、B、C三匹馬的勝出概率分別為0.5、0.3和0.2,而實際賠率為2.2、3.2及2.3倍。如果逐個代入Kelly Criterion,那麼只有A值得投注,投入本金比例f=(0.5*2.2-1)/(2.2-1)=8.33%。

大多數投資者都會以為這樣簡單地把概率p和賠率o代入公式就是正確使用了Kelly Criterion,但這是錯的!試看看同時投注A及B的情況,同時投注A和B,回報是1/(1/2.2+1/3.2)=1.3037倍,A和B兩個選項覆蓋了0.5+0.3=0.8的機會率,故最佳投注比例為(0.8*1.3037-1)/(1.3037-1)=14.15%。

所以這個賭局要投入賭本的14.15%,才能發揮Kelly Criterion的威力,按表面數字直接代入得出的8.33%是錯的。14.15%的賭本如何分配在A、B兩匹馬身上,又產生了新的計算問題。而這僅是一場3匹馬上陣的簡單情況,現實中在香港一場賽馬可多至14匹馬上陣,所涉及的計算量和複雜程度已遠遠超出人力所能應付的範圍,一定要編寫電腦程式才能解決。這等於為Kelly Criterion的使用者設置了一個知識和技術的門檻。

不幸的是,賽馬的情況還是相對簡單的,因為無論一場賽事有多少匹馬上陣,所有馬匹的機會率總和一定是1,其結果是互斥的,最終只有一匹馬勝出,有了這些條件可以利用,對跨過了技術門檻的人來說不算是高難度。至少比計算同時進行的多個獨立賽局(例如一個股票組合或同時進行的多場球賽)要容易一些。

故投資者欲以Kelly Criterion在市場裡尋寶,幾個要點不可不注意:第一,自己是否已擁有一個具優勢的可盈利交易系統?第二,自己的知識和技術是否已經跨過了可正確使用Kelly Criterion的門檻?第三,任何時候都不能忘記,即使所有計算都準確無誤,使用Kelly Criterion也是有可能令人迅速破產的。稍一不慎,天堂很遙遠,地獄在眼前。

2017年6月13日 星期二

食貨

“富民之本,在於食貨。”此語出自《東觀漢記•馬援傳》。

從字面理解,食就是糧食,貨就是財貨了。古時中國是一個農業社會,主要的生產就農業生產,故食與貨實質已代表了當時一個經濟體的生產力和商品流通,甚至可作為國家財政經濟的統稱。

奇怪的是,對發展經濟之道作出如此精辟歸納的,並非當時的學者或文官,而是一直帶兵打仗的伏波將軍馬援。但想深一層又覺得很正常,在東漢之前,所有影響天下格局和歷史發展的大戰,都是由生產力決定戰果,“食力”(原來新界簡的口頭禪才是正字)的影響,遠大於兵力,也難怪惟有行軍打仗的將軍感受最深、理解得最透徹。

例如戰國後期那場規模最大的秦趙長平之戰,雙方傾舉國兵力對峙兩年多時間,秦國雖有補給線漫長等不利因素,卻能靠著商鞅變法後的雄厚“食力”熬到最後,反觀趙國雖然後勤補給方便得多,卻因大量勞動力被牽制在戰場前線,荒廢了一個又一個春耕秋收,而日漸吃不消,被迫換將主動尋求決戰。據《戰國策•齊策之二》記載,“秦攻趙長平,趙無以食,請粟於齊而齊不聽。”證實了趙國是敗在“食力”不濟,留下千古罵名的趙括只是代罪羔羊而已。

又如楚漢戰爭,劉邦之所以可以在滎陽、成皋與“萬人敵”項羽周旋,最後耗垮項羽,很明顯不是贏在戰力、兵力,而是贏在關中源源不絕的“食力”。

據記載,建武十六年,馬援在隴西,上書曰:“富國之本,在於食貨,宜如舊鑄五銖錢。”帝從之。於是復鑄五銖錢,天下以為便。

池某查了一下,這段話有兩個版本,一個版本是“富國之本”,另一個版本是“富民之本”。不過,古語有云:民者,國之本也。故這兩個版本並沒實質的分別。關鍵的是馬援在這次上書中,既強調了發展生產力和商品流通的重要性,還提出了重新發行貨幣的建議,最後達致的效果是“天下以為便”。

人是善忘的動物,有了錢,就忘了本。很自然地,久而久之,原本對生產力的追求,就變成對錢這個中介物的追逐。漢獻帝年間,劉備打下益州,把劉璋的財產賞給了將士,自己倒變成了窮光蛋,連軍隊都養不起了,於是學人玩“財技”,像現今的老千股低價批股抽水一樣,玩了一次“低價批錢”,下令鑄造“直百”大錢,即一個大錢可兌100個五銖錢,很快就抽乾民間資財,庫府裡裝滿了物資。

成功地玩了一次“財技”的劉大耳先生從此就上了癮,又先後鑄了“太平百錢”、“定平一百”、“犍為五銖”等等,都是一錢當一百錢,而且這些大錢越鑄越輕、越鑄越薄,抽水越來越狠。

看到“財技高手”劉大耳天天上頭條,講述以“財商”達致財務自由且變成大富大貴的經驗,東吳的孫權也坐不住了,為證明自己“財技”更高,孫權一出手就鑄了“大泉五百”,不錯,是一錢當五百錢!這還不夠,繼而又推出了“大泉當千”、“大泉二千”和“大泉五千”。


結果,蜀吳兩地當然是貨幣迅速貶值,物價飛漲,經濟環境惡劣,民生凋敝。據記載,位於“天府之國”的蜀國,由建國到亡國時戶籍數字竟是有減無增;處於“魚米之鄉”的吳國亦要派兵到夷洲(今台灣)等地虜掠壯丁充實人口。

同期的曹魏卻是風景獨好,人口最多,墾地面積最廣,實力最強。曹操很早期就大力發展屯田,“積穀於許都以制四方”。後來司馬懿又向曹操建議軍事屯田制,《晉書•宣帝紀》記載:司馬懿向曹操建議,“昔箕子陳謀,以食為首。今天下不耕者蓋二十餘萬,非經國遠籌也。雖戎甲未捲,自宜且耕且守。”曹操行之,魏國一時“務農積穀,國用豐贍。”

可見由曹操到司馬懿都非常清晰地認識到“以食為首”這個“食力”根本。同時,曹魏雖然篡了漢,卻一直維持使用五銖錢,老老實實,沒有像劉備、孫權那樣玩“財技”、鑄大錢將貨幣貶值,貨幣狀況是三國中最穩定的,使老百姓可以保持安居樂業。

令人納悶的是,擺明揚劉貶曹的《三國演義》倒也罷了,連《三國志》等史書居然也沒有給曹氏父子和司馬氏父子這項功績一個公正的評價。不過,話說回來,即使曹氏和司馬氏能活到今天,恐怕也很難討回一個公道。因為價值混亂、顛倒是非的輿論風氣千年以來都沒變過,君不見現時的媒體、blogger,哪個不是只會吹捧“財技”、“財商”,而將真正為社會貢獻生產力的“工資奴”貶到一無是處?

2017年5月23日 星期二

來自美女的邀約


在“一年贏一千萬”文章的留言中,池某曾提及有一位不懂投資也沒學習過投資的朋友,累積財富的成績比起一年贏一千萬的IT人還要好一些,現實中池某對這位朋友的羨慕也遠高於IT人,他就是圖片中美女昭蓉的父親。

當然,整體的人生財富應該以什麼標準來衡量,是見仁見智的,所持股票的市值和所擁有房產的呎數是一種標準,精神的愉悅和心靈的滿足程度又是一種標準。

若單看交易記錄,說昭蓉爸不懂投資是有根有據的,基本上是集合了1997年買樓、2007年買股等不幸操作於一身。但無論是負資產的時候,還是股票坐艇的日子,他都沒有忽略另一項投資,那就是對兒女的投資。由始至終,他都盡力維護一個讓兒女由自發揮的空間,為兒女保留了成為科學家或藝術家等一切發展的可能。

現在,逆境過去了,即使以第一種標準來衡量,昭蓉爸的投資成績亦毫不失禮;若以第二種標準來衡量,更是“恨死隔離”。看着兒女健康成長、成材、成器,是無價的滿足,又豈是有價的資產所能比擬?相信IT人也會同意這一點。

音樂,是昭蓉自己的選擇。沒有贏在起跑線,也沒有靠父幹,在艱苦的學習中尋覓意義,在單調的練習中找到樂趣。凡是對人生有過追求的、付出過努力的,都應有共鳴。

來吧,一同感受一下。

昭蓉畢業音樂會
地點:香港中文大學利希慎音樂廳
時間:6月8日晚上8時
免費入場
不設劃位

P.S. 另有貌似金秀賢的靚仔表演嘉賓,有圖有真相:


2017年5月9日 星期二

IBM

IBM的全稱是什麼? It's Big Money、 I'm Being Mended、 I've Been Mugged、 Irreparable Bad Memory、 I Bought a Mistake、 I've Been Misled、 Incredibly Bad Machine、 International Bad Marking、 Industry Biggest Mistake...

IBM不僅是一間公司、一個品牌、一隻股票,它還曾經代表了一個產業、一個時代。是的,重點是“曾經”二字,它的“別名”越來越多,也標誌著屬於它的時代已日漸遠去。

資訊科技的發展之所以有今天的成就,是因為在不同的時期,都有企業巨頭提供寬鬆的環境給傑出的專家作任何有興趣的研究。比如上世紀四、五十年代的AT&T,旗下的貝爾實驗室匯聚了Claude Shannon和John Kelly等猛人。如今扮演這個角色的是Google,再早一些是Microsoft,再之前就是IBM。

上世紀七、八十年代,IBM工業實驗室出了許多才華橫溢的勁人,包括了五位諾貝爾獎得主,但到了九十年代,由於公司經營艱困,這個實驗室被放棄了。被迫“下崗”的包括了在IBM期間大放異彩的數學怪傑Benoit Mandelbrot,同一時期離開IBM的還有語音及語言處理大師Fred Jelinek,以及解決Maximum Entropy迭代算法的Della Pietra孿生兄弟等等。

上文提及的《數學之美》一書,有多個章節寫到了IBM,其中有一章是專門寫Fred Jelinek的。Jelinek等人創立的BCJR算法,是現今數字通信中應用最廣的算法之一,IBM還將之列為IBM有史以來對人類最大的貢獻之一。但Jelinek等創立者已全部離開IBM,有一次IBM的通信部門需要用到這個算法,不得不從Stanford大學請一位專家去講解,這位專家看到IBM櫥窗裡的成就榜,感慨萬分。

IBM的惡果早在1982年就種下,當時,IBM認為新冒起生產個人電腦的蘋果公司會威脅到自己未來的發展,於是扶持了一家名為Intel的公司為其生產microprocessor,以及一個名叫Bill Gates的“失學青年”為其提供軟件。之後,意想不到的事情發生了,蘋果並沒有被打垮,Intel和Microsoft都迅速發展成巨無霸公司,IBM則舉步維艱,不斷收縮。IBM變成了Intel Bill Macintosh,消費者是I Buy Macintosh,IBM則是I Blame Microsoft。


現在的IBM,連當時承蒙它扶持的“失學青年”Bill Gates都不看好,在其好友股神巴菲特買入IBM股票後,Bill Gates就嘲笑說:證明巴菲特是錯的,IBM對科技的野心已減少,現時的確看不到IBM的長期價值是光明的。巴菲特最後也承認買入IBM是個錯誤,現在他更看好的,正是令IBM一直耿耿於懷的蘋果公司。

IBM為何淪落至此?一位IBM的老員工深刻地道出了其癥結所在:

和每一個帝國的衰落一樣,既得利益者的存在和苟延殘喘是衰落的根源。IBM 的高級管理層已經被這些既得利益者霸佔。他們只有在原有的商業模式下才能夠繼續存活並賺取利潤。他們嘴上冠冕堂皇的擁抱新業務,而實際操作上卻根本無法割捨舊有的運行模式。

華爾街在這個過程中也扮演了非常惡劣的角色。財務分析師是冷酷的,他們只看報表。於是 IBM 這些沒有魄力高管們只能在傳統業務上敲骨吸髓,因為新業務的發展不是一蹴而就的,無法立即滿足華爾街的胃口。同時這些人也寄希望於能夠熬過他們利益兌現的日子,然後拍拍屁股走人。所以,和每一個王朝的衰落一樣,大家在英明的決策中走向死亡。

結論:投資一間公司的股票,並不在於這間公司曾經多偉大,也不在於用什麼價錢買入一間偉大的公司,關鍵是這間公司未來能否保持偉大甚至變得更偉大。如果這個疑問未確定就下注,與賭一舖大細無異。只以過去的財務報表作縱向分析,而無視市場現況作橫向比較,不過是在找麻醉自己的藉口,去滿足自己的賭癮,結果就是IBM:Idiots Bought Me。

2017年5月1日 星期一

法無定法

何元普,晚清人物,是個讀書人,英法聯軍火燒圓明園時投筆從戎,任北京總理外城巡防,負責保衛京師,被譽為“戎馬書生”。後因在官場發展不如意,42歲左右憤而“劈炮唔撈”,過着財務自由唔駛do的令人艷羨生活,整天跑到寺廟裡與和尚談禪論詩,於是他的文才武功也就變得鮮為人知,反而是他在四川新都寶光寺留下的兩句話,一直被人傳誦至今,就是那副天下名聯:

  世外人法無定法然後知非法法也
  天下事了猶未了何妨以不了了之

池某是在大學寫作班教授印發的notes裡第一次看到這副對聯,頓時把平仄對仗等賞析標準忘記得一乾二淨,而被其超脫的意境深深震動,至今難忘。

上文談到翻譯,真是不敢想像Google translate會把“法無定法”、“非法法也”譯成怎樣的笑話,池某倒是想起一句頗合其意思的英文,“The only rule is no rule”。亦可見擺脫教條主義條條框框的約束、突破傳統的思維限制,是古今中外皆然的人類智慧。

接回上文再從機器翻譯談起,有別於傳統利用語法規則作處理的做法,Google translate是“非法法也”地只使用了一個很簡單的統計語言模型。池某在一篇文章中看到,“事實證明,統計語言模型比任何已知的借助某種規則的解決方法都有效。在Google的中英文自動翻譯中,用的最重要的就是這個統計語言模型。美國標準局(NIST)曾對所有的機器翻譯系統進行評測,Google的系統不僅是全世界最好的,而且高於所有基於規則的系統很多。”

這篇文章的作者為吳軍博士,曾擔任 Google Research的資深研究員,在 Google 主要的貢獻包中日韓搜索算法,Google Anti -Spam的創始人,且是中日韓搜索部門的創始人。吳軍博士曾發表一系列談及以數學方法解決信息學問題的文章,後來集結成《數學之美》一書。


書裡深入淺出地介紹了很多處理海量、複雜信息的奇招妙法,令人嘆為觀止。例如以隱含馬可夫模型(Hidden Markov Model)解決語音識別,又如最有效的新聞分類方法竟是中學的數學知識Cosine Law。而最令小賭徒池某精神為之一振的,是那篇對最大熵(Maximum Entropy)模型的討論。最大熵,名字看起很可怕,原理卻很簡單,就是保留全部的不確定性,將風險降到最小。

解決不確定性,把風險降到最小,是每一個賭徒、投資者難以抗拒的誘惑。然而,雖然數學家早已證明了,對任何一組不自相矛盾的信息,這個最大熵模型不僅存在,還是唯一的,且是以簡單的指數函數形式存在,但要實現最大熵模型卻很複雜,計算量龐大。

吳軍博士寫道,80年代,很有天才的Della Pietra兄弟在IBM對最大熵模型的算法作了很大改進,但90年代初他們就退出了學術界,到金融界大顯身手。他們兩人和很多IBM語音識別的同事一同到了一家當時不大,但現在是世界上最成功的對沖基金公司Renaissance Technologies。“我們知道,決定股票漲落的因素可能有幾十甚至上百種,而最大熵方法恰恰能找到一個同時滿足成千上萬種不同條件的模型。Della Pietra兄弟等科學家在那裡,用最大熵模型和其他一些先進的數學工具對股票預測,獲得了巨大成功。”

池某查了一下網上資料,1989年到2009年間,Renaissance Technologies的大獎章基金平均年回報率高達34%,較同期標普500指數年均回報率高20多個百分點,比索羅斯和巴菲特同期的操盤表現都高出超過10個百分點。即使是在次貸危機爆發的2007年,該基金的回報率仍高達85%。

語音識別、機器翻譯,與股票投資看起來是風馬牛不相及、大纜都扯唔埋的事情,操作方法竟然可以互通使用,算得上是“法無定法”、“非法法也”的最佳印證了。

2017年4月24日 星期一

翻譯

之前看到Cherry談及blog文被讀者用Google translate整篇翻譯,池某也開始留意一下流量來源是否有這種“怪事”。當然,心裡是不抱什麼期待的。畢竟,程式賭馬、統計賭波,甚至量化投資等等,本來就是鬼佬的玩意,正常人都會看原汁原味的外文文章或英譯中版本,看中譯英版本完全沒有必要。意外的是,“怪事”還是零零星星地發生了,其中在流量來源出現得最多的是這篇:


乍看之下池某也搞不清楚這是哪篇文章,就算睇埋內文,也想不起哪篇blog文是用“四個星期日”開頭的。根據發表日期翻查,才發現被譯作“Small production works”的其實是“小製作 大工程”。而內文的“four Sunday”,則是機器翻譯將“四個星期日以繼夜”分詞錯誤所致。

機器翻譯是否可靠,是個見仁見智的問題。若只以模糊正確為目標,再加上自己的猜想作補救,會較容易接受。有國際版的翻譯員就曾對池某說,Google translate太強大了,英譯中連中國過去的外交政策叫“韜光養晦”也能準確譯出,如果其他錯誤率再降低一些,國際版翻譯員都要失業了。

若把要求提高一些,則不難發現機器翻譯仍有很多未能克服的盲點,除了上述提及的分詞問題,古文、古詩詞(例如那個經典的“松下問童子”的例子)、缺乏上文下理的抽象語句,或者地方的方言俗語等等,機器翻譯都拙於應付。

大概兩三年前,池某公司新來的翻譯員處理一篇鬼佬文章時,練精學懶偷偷用Google translate做來,以為可以“過骨”,結果把內文描述朱鎔基就任總理時當時的美國財長Lawrence Summers仆去北京“kiss Zhu's ring”,直譯成“親吻朱的戒指”,她那不學無術的主管還以為執到寶,學人玩Gimmick直接用這句來起題,氣得池某沒留下半句解釋就把她們的勞動成果刪到垃圾桶。

機器翻譯、語言識別等語言處理問題,早在上世紀八十年代在美國就有富有成果的研究,理論上無論是美式俗語還是英式俗語都應能準確掌握,沒理由經過幾十年發展仍犯這種“低級錯誤”。實際上,機器處理語言的語法規則確實是經歷了幾十年而無顯著突破。因為機器並不能真正“學習”語言,只是根據統計語言模型(Statistical Language Models)來處理語言問題。

所謂統計語言模型,簡單地說,就是利用conditional probability,計算一個文字序列構成某個有意義句子的可能性。咦?聽起來似曾相識,像池某這樣的小賭徒,把文字序列的詞語換成贏馬因素,不就變成可以計算頭馬的可能性嗎?同樣道理,換成股票的升跌因素,應該也能計算股票升跌的可能性。

現實確是這樣的。機器處理語言之所以經歷了幾十年而無突破,原因之一應是上世紀八九十年代在這個領域研究處於領先地位的猛人忽然集體消失了。他們哪裡去了?正正就是把相關理論和技術應用到股票投資,集體轉戰華爾街,還個個賺到盤滿鉢滿。

下回再談。

2017年4月11日 星期二

50+50>100+0

大學時選修普通話課程,赫然發現班裡竟有兩名本來就是說普通話的大陸交換生也來“呃學分”,學期尾考試時證實了果然是“不公平競爭”,試卷很大部份內容是要求把“瞓嚟頸”這類廣東話用語用轉為普通話,連題目都搞不懂的交換生,眾望所歸地包辦了倒數一二名。

後來有一次看新聞,對於社會上批評香港大學生英文水平越來越低的論調,當時有一位大學校長挺身而出為學生辯護,認為語文作為溝通與交流的工具,不能單用英文科的分數來衡量,英文100分能力而中文0分能力的人,和中英文都是50分能力的人,雖然總分都是100分,但肯定是後者的綜合能力較高,因為前者可作溝通交流的範圍要狹窄得多。

對於這種說法,池某的理解是,如果一件事情需要兩門或以上的知識去完成,那麼,要達致最佳效益,不是偏重於某一門知識,也不是看加起來的總分,而是要看所需的多種知識的geometric mean,偏差嚴重的長短腳,走不快也走不穩。

據說,在民國年代,大學的入學試有類似“三角幾何三角,三角三角,幾何幾何”這樣的題目,看得懂的認為是送分,看不懂的罵不絕口。是難是易,正是在於理解的偏差。

最近收到不少blog友的email,詢及賽馬統計模型問題,池某已盡自己所能回覆,但有些技術問題確實是超出了池某的理解能力,池某只能是知之為知之,不知為不知,不會也沒必要扮無所不知的專家,未能回答的,請見諒。

譬如,有IT高手認為,可運用其高超的IT技術,以AI取代人手砌模型,像AlphaGo那樣,不斷自我學習、優化,最終將砌出完美無敵的模型。哇!AI,Artificial Intelligence,人工智能,池某呢個IT白痴識條鐵咩。

問題是AI如何憑空學習?據池某所知,AlphaGo也不是從零開始的,AlphaGo團隊裡的黃士傑博士,本來就是圍棋6段高手,即使是AI,也要先有了基礎,才能透過學習去優化、改良。那麼賽馬統計模型的基礎是什麼?當然就是賽馬知識和database了。

問題又來了,如果本身就有賽馬知識也有可用的database,用統計軟件做一次regression就能得到所需的參數了。賽馬模型和圍棋不一樣,圍棋每下一步都有新的、接近無限的可能和變化,故AI大有用武之地;賽馬模型則是越穩定越好,固定下來就很少變化,無所事事了。砌模型這種殺隻雞般的小事情,不斷舞動AI這把牛刀又有何效益呢?

從blog友們的來信來看,這種企圖發揮一技之長以取代其他知識,強行解決問題的思維不在少數。其中最多的傳統的賭馬高手,認為自己眼光獨到、命中率高,希望能掌握一些簡單的數學方法,每場剔除幾匹機會率低的馬匹,就能保持長線盈利云云。這樣的問題同樣令池某難以回答。我們使用統計模型代替主觀決策,就是因為承認自己眼光差,對機率的估算不是高估就是低估。若眼光好、命中率高,何必用程式制肘自己的發揮?

賭馬是一個系統工程,系統工程就是對多種知識和方法的有效整合,若如上述所言,整合的效益最大化就是各種知識geometric mean的最大化,顯然,補短比取長更重要。


2017年4月1日 星期六

賽馬冷知識

這次重砌model在2月底大致完成,參數的數量確定下來後,在過去一個多月只需作少量微調,再沒有大的改動。從2月26日至3月29日,剛好經歷了10個賽馬日,包括了日馬、夜馬、沙田、快活谷、全草地、全泥地和泥草混合,也包括了讓磅賽、平磅賽,跑過好地、好快地、好黏地,開過2倍以下的熱門,也爆過逾100倍的大冷門,算是對model作過全方位的考驗,正好檢討一下model應付不同情況的優點與不足。

賭博遊戲最令人擔心的是大幅虧損,若出現50%的虧損,須取得100%的盈利才能扳回損失,故這次選擇以一個極保守的Kelly比例進行觀察。若逐個賽日作單式計算,共有三個賽日出現虧損,幅度分別是3.5%、5.3%和5.9%,所幸的是,出現虧損的次數和幅度都比盈利低一些,七個盈利賽日的盈利率在4.7%至13.5%之間。

虧損最嚴重的是3月12日沙田賽事。見習騎師巫顯東當日以“獅子聰”和“育成寶貝”兩匹馬“起孖”,由於database裡的紀錄是巫顯東過去上陣100多次僅得1次頭馬,使model無法應付當日的巨大反差;另外,第九場重注馬“美麗寶寶”被“魅力知友”追到平頭,分去一半彩金,也使當日的收入大減。

(圖片來源:香港馬會)

另一個虧損超過5%的日子是3月22日快活谷賽事。本來當日的表現只是窄幅上落,直至第六場重注了排C跑道無敵一檔的“好益善”,看到開閘前變成“綠格”3.7倍次熱門,更是信心滿滿,不料最後三甲不入。賽後獸醫檢查證實“好益善”患有“喘鳴症”。“喘鳴症”,model裡沒有這個factor,也想不到如何設置這種極少樣本的參數。

曾經看過一套紀錄片,講述美國等地的牧場主,絞盡腦汁,以血統、遺傳工程等新舊方法相結合,以期培育出完美的純種競賽馬,在週歲拍賣會中取得天價暴利。不過,很多這些精心傑作,往往會因為一些極細微的外在瑕疵而身價大跌,欲哭無淚。

然而,馬主購買未有上陣紀錄的週歲馬,真正的風險,還不是外表能看出來的。即使拿著伯樂的《伯樂相馬經》按圖索驥,也未必能找到一匹好馬,因為現代賽馬鬥的是極速衝刺,而不需要日行千里。支持一匹體重逾千磅的馬高速奔跑,需要大量的氧氣供應,且要維持良好的血液循環機能,故真正決定一匹速度賽馬成就的,是其外表看不到的部份:心肺功能和呼吸系統。

馬匹的呼吸系統是其供氧環節的瓶頸,從而影響其競賽能力。馬不能用口呼吸,只能用鼻子呼吸,而由鼻孔至肺部的呼吸道又長又窄,鼻孔和喉嚨更是呼吸道兩個最窄的部份。有些馬匹聲帶癱瘓,鬆弛的聲帶阻塞氣管入口,呼吸道在氣流通過時發出異常聲響,就是“喘鳴”。由於“喘鳴”代表馬匹吸入的空氣大大減少,因而會令其表現大打折扣。

同樣原因,說明了為什麼馬匹在陣上流鼻血、氣管有痰、氣管有血、心律不正等內在毛病,影響會比腿部割傷、蹄鐵鬆脫等外傷和意外要大得多。

還有一個冷知識,馬匹奔跑時,是四蹄着地,其前肢與胸腔相連,使得馬匹極速奔跑時不能像人一樣自主調節呼吸,只能一步一呼吸,前蹄離地時展開胸腔吸氣,前蹄着地時呼氣,呼吸頻率受到步頻的制約,也會因氧氣的供不應求令步頻難以一直維持,故馬匹無法作長距離的極速衝刺,大多數都是狂奔二三百米就迅速轉弱。

於是,如何在不同步速的賽事中把握好發力點,把馬匹短暫的爆發力有效發揮出來,成了決定勝負的關鍵,而非必然是強者恆強,同樣的幾匹馬在不同的賽事形勢中互有勝負反而是常態。這些不確定因素,增加了賽馬運動的樂趣,也增加了賽馬博彩的刺激。

2017年3月27日 星期一

隔山打牛

去年這個時間寫過兩篇賭海外賽馬文章,實際上池某對賭海外馬一直不熱衷,原因有很多:

第一,海外馬的expected odds無法自己計算,即使獲利,也沒什麼成功感。

第二,既然海外馬的“expected odds”是公開的,除非有大量香港馬參戰,或香港馬迷力棒的騎師出賽,否則edge不會太大,輸贏都很有限,很難寄予厚望。

第三,因為海外馬的edge不大,使得開閘前一刻對賠率變化的把握尤顯得重要,賠率和注碼的小小改變就令盈虧逆轉。這就要求開跑前一定要緊盯電腦,困身而利小,令賭海外馬變成雞肋。

早陣子想到杜拜世界盃又至,同時也為賭海外馬的麻煩而躊躇。這時,想起了IT人寫的那個app,但有一點不是很確定,當初池某給IT人的Kelly calculator樣本,是根據香港的情況以一場14匹馬為上限的,海外賽馬有時一場多達16匹,甚至24匹馬上陣,這個app是否適用,是一個疑問。

於是給IT人send了一個message,問了一句上限問題,很快就收到其霸氣回覆,“幾多隻都得!”這就好辦了。


一如所料,杜拜世界盃賽日大部份場次的edge都不大,只在微贏與微輸間徘徊,但在最少馬匹上陣的第五場出現了驚喜,9倍的“木球能手”爆出半冷,且edge不小,總算不至於白做一晚。


利潤不算多,卻留下了一個很大的思考空間。這裡並沒有自己付出努力的概率計算,而所使用的資訊又早就是公開的,那麼其間的利潤出自何處?除了其他投注人的決策錯誤之外,應該就是對資訊時間差的把握了。若早了一兩分鐘下注,盈虧的結果也會大不一樣。

資訊的差距,從來都是有價值的。資訊閉塞的年代,有“家書抵萬金”之說;“錢多、人傻、速來”,雖常被用於調侃,卻深刻地描畫了資訊差距的價值。Fortune's Formula一書,記錄了賭馬與信息學發展長期以來的互為影響,Kelly criterion就是以為“不公平信息”定價作為出發點的。

互聯網的普及,令“隔山打牛”的資訊接收成本降至幾乎是零,買外國股票、買外國基金、買外國樓、賭海外馬,都不再是盲人摸象。壞消息是,大眾更容易公開、公平地獲取同樣的資訊,會令市場更有效、盈利空間更狹窄。有效市場假說(Efficient-market hypothesis)的三個假設大前提,其中一個就是,“資訊實時公開且獲得資訊無需負擔額外的成本”。

故此,現今在市場博奕,競爭的不僅是資訊的獲取,更關鍵是有效使用資訊時機的準確捕捉,機會只在瞬間,差之毫釐,回報是天壤之別。“一萬年太久,只爭朝夕”。Out了,現在是“朝夕也嫌久,只爭分秒”。

2017年3月2日 星期四

繼續Kelly Criterion

投稿到媒體緣於塘人兄那句玩笑話。塘人兄說,懷疑香港的媒體有潛規則,blogger的文章一旦被刊出,就要unlink塘人兄的blog。實踐是檢驗猜說的唯一標準,是真是假,試試便知。


本以為這種blogger的口水貨最多放在網上攝下位走過場就算,沒想到老總很認真地回覆,說看起來也應合雜誌讀者的口味,不如放到雜誌。那就當然要客隨主便了。忽然有一種奇怪的感覺湧起,池某平日的工作是處理別人的來稿,這次卻身份逆轉,變成被處理,聽候發落,報應也。

雜誌是月刊,一個月才出版一次,加上這類稿件沒有時效性,慢慢等吧,只是“實驗”的時程也拉長了,期間塘人兄還要玩搬blog,嚇得池某連忙add晒新舊網址,以確保“實驗”結果可靠。

另一個想不到的是池某的身份被變成“財經博客”,看來要學學Mike兄、森而兄那樣多加些親子、生活題材,將blog的內容多元化了。池某一直沒有為自己所寫內容的定下專門的、特定的範疇,寫這個blog的初衷,在本blog的第一篇blog文已作了說明,就是記下一些需要記得的知識和資訊,特別是那些細微而容易被忽略、漠視的,故取blog名為“積微錄”。

“積微”一詞,出自荀子《強國篇》:

積微,月不勝日,時不勝月,歲不勝時。凡人好敖慢小事,大事至,然後興之務之。如是,則常不勝夫敦比於小事者矣!是何也?則小事之至也數,其縣日也博,其為積也大。大事之至也希,其縣日也淺,其為積也小。故,善日者王,善時者霸,補漏者危,大荒者亡!故,王者敬日,霸者敬時,僅存之國,危而後戚之。亡國,至亡而後知亡,至死而後知死。亡國之禍敗,不可勝悔也。霸者之善箸也,可以時托也。王者之功名,不可勝日誌也。財物貨寶以大為重,政教功名者反是,能積微者速成。詩曰:德如毛,民鮮克舉之。此之謂也。

兩千多年前的文章,論述深刻厚重,指明了為人處事的應有態度,以現代的眼光來看亦不覺過時。文章的大意,用今日的話說,就是大多數人都好高騖遠,對小事不上心,一心只想做大事,實際上這種只想做大事的人,並不如那些認真做好每日小事的人。因為小事很多,每日都有,累計所費的精力與時間很多,但累積的成果也大;真正的大事並不常發生,累計所費的時間與精力不多,積累的成果也少。所以,積累微小之功,實際上是能最快成功的。

用大眾更熟悉的語言來說,就是大多數人一心只想買中隻倍升股或扒個大冷門,一夕發達,實際上最終表現並不如那些長期在平常市況取得平常回報的人,因為大多數市況都是平常的,平常的回報不斷累積就會變得很不平常;而大冷門並不常發生,即使偶然中一次,攤長來看回報也會變得很平常。

中一次100倍和中十次10倍,回報和風險不是一樣嗎?當然不一樣,因為有複式效應,因為有Kelly Criterion。

2017年2月9日 星期四

日格一物

  已有好些日子沒有更新網誌,這段時間實在太忙──忙於“砌模型”,日砌夜砌,砌完又拆,拆完又砌,沒完沒了。

  令池某玩物喪“誌”(荒廢網誌)的模型,與70後兄經常貼上網的模型有些不同,無色、無樣、無形,學名叫Logit Model,籠統地說,是統計模型的一種;砌這種模型的工具也有別傳統,要用coding。砌Logit Model令人著迷之處是:第一,極難砌,可以滿足挑戰高難度那舖癮;第二,若砌得好,將成為有力武器,可以從馬場贏錢。


  窮忙的日子早在去年11月中就開始了。要砌得成模型,需要原材料,Logit Model所倚賴的原材料,是database,故動手砌模型之前,要先準備好database,那是一件體力活,耗時、費勁,部份數據要靠人手輸入,還不太順利,中間小錯誤不斷(主要是手指太肥),辛苦了一個多月,總算如期完成。

  之所以要訂下一個“期”,是看中了12月最後兩個星期只有兩個賽馬日。如同那些大江大河的水利工程一樣,要截流動工,當然是選擇水流量較少的枯水期進行,否則一邊輸入舊數據,一邊忙於更新賽果,一邊改program銜接新數據庫,是不可能的任務。若錯過這個“期”,就要等到暑假了。

  完成銜接新數據庫的program,相當於在截流前開通了導流明渠,之後的工程進度就不用太緊張了。水照流,馬照跑,賽果照更新,模型慢慢砌,邊砌邊賭,效果理想就繼續,不理想就用回舊版,將新加的部份推倒重來。

  砌模型的最大難處,是每加一個factor,其效果都無法預先想像。不同的factors有些會相輔相生,有些會相斥相尅,結果是可能進兩步退一步,也可能是進一步退兩步。好比用不同形狀的磁石砌一間屋,既要利用相吸的部份維繫整個架構,又要利用相斥的部份拓出空間。每加一塊石,都有可能擾亂原本的格局。

  另一個麻煩是,只有看到試出來的統計指標,才知道是不是比原來的更好,永遠不知道是否可以做到更好,更不知道是否存在一個最好,只能一個個參數試,試完再試,試過才知。

  於是想起了那句古老的話:格物致知(出自《禮記‧大學》)。沒辦法,誰叫自己沒有背兩句教條就成為大師的頓悟慧根,也沒有跳求雨舞的特異功能?只好一個factor一個factor地“格”下去了,今日試一個factor,明日再試一個factor,希望最後能像宋代程頤所說,“今日格一件,明日又格一件,積習既多,然後脫然自有貫通處”吧。

2017年1月15日 星期日

重整賽馬model之後,以近兩個月的戰績來看,出現虧損的頻率與幅度大幅減少了,同樣,盈利的頻率與幅度亦有減無增。原因是,越來越多的場次是這樣的情況:


和局。無注可下。

雖說two-step model會令計算結果與實際賠率趨同,但完全沒有edge的和局,只有在所計算的期望賠率與實際賠率極接近時才會出現。這說明了賽馬市場和股票市場一樣,雖然不是完全有效,有些時候還是相當有效的,並非遍地傻錢任由予取予攜那麼簡單。

若細看盈虧的具體場次,更能說明這一點,越是資料充足、平淡無奇的賽事,就越難找到下注空間,這是因為其他參與者也能在機會率與賠率之間作出冷靜的判斷。反而在有一面倒明星馬的場合,存在更多不理性的錯價,每次“巴基之星”、“京京千里”這些不乏死硬捧場客的明星馬落敗,利潤總是特別豐厚。

不過,要在這種場合搵食也不是一容易的事。明星馬之所以備受大眾追捧和信賴,當然是有其過人之處,即使是機會率被過份高估,實際的贏面還是很大的,要從其對立面贏錢,首先是要輸得起,而且可能是連輸很多次,才等得到一次除笨有精的高回報機會。

這樣的操作好像似曾相識,不錯,《黑天鵝》作者Nassim Nicholas Taleb在介紹其期權操作時也是這樣說的,他的目標是下不對稱的賭注,不介意不斷輸點小錢,一旦被人嚴重低估的事件發生,就能得到超常規報償,一次過連本帶利取回所輸的,甚至遠遠超過。

看來,投資博奕之道確有很多相通之處,

談到博奕,池某只是完全不入流的低手,至少,池某家裡的化骨龍是這樣認為的。特別是那條小化骨龍,他的第二偶像叫AlphaGo,第一偶像叫吳清源,為了沾染一下這位被稱為“神”又被稱為“聖”的猛人氣息,他還特別跑了一趟地獄谷溫泉。據他說,吳清源認為對奕的最高境界,就是“和”。

好奇之下查看了一些資料,原來此“和”並非彼“和”,而是跳脫局部,不過份計較一時一地的得失,放眼大局下的和諧。

池某乃此道的門外漢,未必能完全理解這位“神人”、“聖人”的高深智慧,但套用到池某熟悉的語言,似乎也說得通:跳脫片面的思考,不過份計較一場一局的得失,放眼大數法則下的edge