2017年4月11日 星期二

50+50>100+0

大學時選修普通話課程,赫然發現班裡竟有兩名本來就是說普通話的大陸交換生也來“呃學分”,學期尾考試時證實了果然是“不公平競爭”,試卷很大部份內容是要求把“瞓嚟頸”這類廣東話用語用轉為普通話,連題目都搞不懂的交換生,眾望所歸地包辦了倒數一二名。

後來有一次看新聞,對於社會上批評香港大學生英文水平越來越低的論調,當時有一位大學校長挺身而出為學生辯護,認為語文作為溝通與交流的工具,不能單用英文科的分數來衡量,英文100分能力而中文0分能力的人,和中英文都是50分能力的人,雖然總分都是100分,但肯定是後者的綜合能力較高,因為前者可作溝通交流的範圍要狹窄得多。

對於這種說法,池某的理解是,如果一件事情需要兩門或以上的知識去完成,那麼,要達致最佳效益,不是偏重於某一門知識,也不是看加起來的總分,而是要看所需的多種知識的geometric mean,偏差嚴重的長短腳,走不快也走不穩。

據說,在民國年代,大學的入學試有類似“三角幾何三角,三角三角,幾何幾何”這樣的題目,看得懂的認為是送分,看不懂的罵不絕口。是難是易,正是在於理解的偏差。

最近收到不少blog友的email,詢及賽馬統計模型問題,池某已盡自己所能回覆,但有些技術問題確實是超出了池某的理解能力,池某只能是知之為知之,不知為不知,不會也沒必要扮無所不知的專家,未能回答的,請見諒。

譬如,有IT高手認為,可運用其高超的IT技術,以AI取代人手砌模型,像AlphaGo那樣,不斷自我學習、優化,最終將砌出完美無敵的模型。哇!AI,Artificial Intelligence,人工智能,池某呢個IT白痴識條鐵咩。

問題是AI如何憑空學習?據池某所知,AlphaGo也不是從零開始的,AlphaGo團隊裡的黃士傑博士,本來就是圍棋6段高手,即使是AI,也要先有了基礎,才能透過學習去優化、改良。那麼賽馬統計模型的基礎是什麼?當然就是賽馬知識和database了。

問題又來了,如果本身就有賽馬知識也有可用的database,用統計軟件做一次regression就能得到所需的參數了。賽馬模型和圍棋不一樣,圍棋每下一步都有新的、接近無限的可能和變化,故AI大有用武之地;賽馬模型則是越穩定越好,固定下來就很少變化,無所事事了。砌模型這種殺隻雞般的小事情,不斷舞動AI這把牛刀又有何效益呢?

從blog友們的來信來看,這種企圖發揮一技之長以取代其他知識,強行解決問題的思維不在少數。其中最多的傳統的賭馬高手,認為自己眼光獨到、命中率高,希望能掌握一些簡單的數學方法,每場剔除幾匹機會率低的馬匹,就能保持長線盈利云云。這樣的問題同樣令池某難以回答。我們使用統計模型代替主觀決策,就是因為承認自己眼光差,對機率的估算不是高估就是低估。若眼光好、命中率高,何必用程式制肘自己的發揮?

賭馬是一個系統工程,系統工程就是對多種知識和方法的有效整合,若如上述所言,整合的效益最大化就是各種知識geometric mean的最大化,顯然,補短比取長更重要。