[1+f(p(1+b)-1)]^T = (1+0.5f)^T
注意到上面期望值的意思是:如果我可以重複一模一樣的實驗無限次時(毎次實驗玩T回合),而每次都下注f 比例,則隨著重複實驗次數越多,毎次實驗的資產平均值會越接近(1+0.5f)^T。
在這樣的條件下,當然f=100%是最好的選擇,因為計算出來的期望值最大。上篇文章很多人認為問題是出在 f=100%,如果你有仔細思考過,就知道這絕對不會是問題。
如果我每次實驗的T步過程把把全押,在T步內輸光就停止。如果沒輸光,則這條路徑(一路連贏T次)所帶來的報酬將使整體平均資產(重複實驗的平均)大大提高。即使這個機會很小,但因為實驗可重複無限次,只要遇到一次連贏,那就是會有這樣的"期望值",這也是期望值的意義。
在繼續講下去之前,基於上篇的激烈討論與認為牧清華數學程度有夠差的指教,我還是認為有必要先用文字敘述的方式講解一下期望值的概念。
這裡所說 "可重複無限次的實驗",可以想像是當毎次實驗結束後,就乘坐時光機回到當初實驗的時間點與回到相同的環境條件,當然包刮又有原始資金讓你"再重複作一模一樣的實驗"。然後把過去每次時光旅行後的實驗結果加總起來平均,叫做"期望值"。
從直觀意義去解釋正期望值
試想一下當我們遇到正期望值的賭局。何謂正期望值? "平均來說",每玩一次,1元可以變為x元,且x>1。再強調一次,這裡的"平均來說",是說實驗可以重複無限次後,加總的平均。既然每玩一次1元可變成x元,x又大於1。在這樣的好康下,當然是押越多越好,押100元就變為100x元,押1000元就變為1000x元。因此,在利潤最多的驅使下,下注金額是多多益善,有多少押多少,如此思考公式推導出來為f=100%也不足為奇了,但記得這樣的敘述是平均來說。(在強調一次,因為是"平均"賺最多,所以是考慮實驗可重複無限多次的情況下)。然而這真的是我們要的最佳化嗎? 記得我們的目的是"賺最多錢",但上面的結果是"實驗無限多次後,平均起來賺最多錢"。與現實不同的是,我們只有"一次實驗的機會"。
所以這真的是我們要的最佳化嗎? 很明顯答案是"NO"!
可惜的是對於上面這件事,我 們 無 能 為 力!
如果你要根據期望值下注,那下注100%的確是最好的下注方式,但是你要保證你可以重複這個實驗無限多次,然後最後你的損益是這無限多次實驗結果後的平均。可惜實驗無限多次作不到,未來發明了時光機或許有可能!
但也別那麼絕望,對於"只有一次實驗機會賺最多錢"這個目的,我們仍然可以將目標放在:
將T步裡,每一步的 "期望平均複合成長率" 最大化。
意思是說,我們無法重複玩一模一樣的賭局很多次,所以不能拿期望值最佳化當作我們獲利最大化的設定。但如果要玩T步(一次實驗裡賭T次),我們可讓每一步的 "期望平均成長率" 最大。
"期望平均成長率"的意思是說: 在T步過程中,不管是哪一個路徑到達最後的結果,平均來說(幾何平均),每一步的成長率最佳化。講明白點,我們不能回到過去的時空(空間)重複時驗,但我們可讓這場賭局的時間長長久久(無限多局數),使得幾何成長率最大化。這是一種時間換取空間的概念。
人生不能從來,但可讓過程長長久久,細水長流
一樣考慮勝率50%,賠率為2的賭局。如果我今天玩一次實驗就走,不玩了。則玩一次的資產成長率期望值為
50%*(1+2f) + 50%*(1-f) = 1 + 50%f
也就是我們熟悉的期望值(or 算術平均數)。因為只玩一步,這個值同時也是幾何平均報酬。我想沒有人會有爭議,很明顯要"最大化期望值",f 要選擇100%。畢竟你只有一次機會,贏了就走,輸了也走。有一半的機率輸光,有一半的機率贏錢,且翻兩倍。期望報酬為1.5倍,也就是賺5成。但是你會全押嗎? 不會,除非你賭性堅強,因為大家都知道還有一半的機會會輸,輸光就沒了,即使你只玩一次你也不會想要輸光。
如果你賭兩次,兩次後就不玩走人。分析如下:
Case1. 25%的機率 win, win: 資產成長率為 (1+2f)(1+2f)
Case2. 25%的機率 win, lose: 資產成長率為 (1+2f)(1-f)
Case3. 25%的機率 lose, win: 資產成長率為 (1-f)(1+2f)
Case4. 25%的機率 lose, lose: 資產成長率為 (1-f)(1-f)
注意到,我們希望的是玩兩次後的資產成長率最大;我們要計算的是資產成長率的幾何平均報酬,因此上述每一種情形的資產成長率還要再開二次根號,才叫在這個case底下的幾何成長率。
Case1. 25%的機率 win, win: 資產成長率的幾何平均為 [(1+2f)(1+2f)]^(1/2)
Case2. 25%的機率 win, lose: 資產成長率的幾何平均為 [(1+2f)(1-f)]^(1/2)
Case3. 25%的機率 lose, win: 資產成長率的幾何平均為 [(1-f)(1+2f)]^(1/2)
Case4. 25%的機率 lose, lose: 資產成長率的幾何平均為 [(1-f)(1-f)]^(1/2)
將上述四個值平均後 (相加後除以4),稱為"期望平均複合成長率" (EACG, Expected Average Compound growth)。在只玩兩次的條件底下,我們真正要最佳化的是這個值(EACG),而不是單純的最佳化四個Cases的算術平均。
下面左圖是玩一次就走的情形,全押是最好。下面右圖是玩兩次就走的情形,壓50%時EACG最大,有1.125的EACG。這意思是說平均每次下注 f=50%,資產會成長1.125倍,也就是淨賺12.5%。
只玩三次的最佳下注方式為f=37.868%,資產成長率為1.09283;
只玩四次的最佳下注方式為f=33.626%,資產成長率為1.082059。
"期望平均複合成長率(EACG)" 分別如下:
只玩六次的最佳下注方式為f=30.19%,資產成長率為1.073467。
"期望平均複合成長率(EACG)" 分別如下:
根據我們上述只玩1次到只玩6次的實驗數據,有沒有發現所押比例f越來越低,EACG也跟著越來越低。如果再繼續讓T跑下去,你會發現下注比例f會慢慢接近25%,當玩無限步時,那最佳下注比例就是凱利的25%了。如下圖所示,綠色水平線25%是藍色最佳下注比例的漸近線。
很神奇吧! 我們追求的是凱利比例沒錯,但記得那是一種當賭局準備玩無限多步時(T=無限大)的最佳化過程。可惜賭局局數往往是有限的,人生也是有限的,是不是該take有限局數下的最佳化f,那就是賭徒在思考的問題了! (意思是說風險過大,想想T=1梭哈後輸光的極端Case!)這跟人生道理很像,賭局是有限的,人生也是有限的。賭徒追求的是一次利潤最大化。但因為時光不能重來,我們只能當作無限步的賭局去最佳化下注(Kelly);人生也是有限,人生追求的是穩定中求成長發展,所謂的穩定,是衡量風險承受後的最佳化過程,考量的是長遠下來利益最大化的結果。
賭博人生,如此而以!
星期二;一天一錠,效果一定,歡迎訂閱「幣圖誌Bituzi電子報」
牧清華很喜歡彭明輝教授"困近與抉擇"文章裡的一句話:生命是一種長期而持續的累積過程,絕不會因為單一的事件而毀了一個人的一生,也不會因為單一的事件而救了一個人的一生。
彭教授很厲害,從人生的角度也看出博弈與交易的根本道理:每一次的失敗都是一個過程而以,每一次的成功也只是過程。我們追求的是每次都比上一次更進步,我們最佳化的是每次進步成長最大。也就是人生這輩子的EACG,而不是人生輪迴多次的期望值!
0 意見:
張貼留言