第21部分（2 / 4）

小說：策略思維作者：泰達魔王

圖7…5發球手攻正手的機率（％　）

現在我們從接球者的角度考察這個問題：他要努力使自己的最小收益最大化。如圖7…6所示，假如接球者一半時間向正手方移動，一半時間向反手方移動，他的新的收益曲線就是原來兩條直線的平均值，以點線顯示。由於這條直線是向上延伸的，其最小值永遠出現在左端，該點的成功率為40％。無論接球者向兩方移動的比例是多少，這條直線一定經過成功率為48％的那一點，這是因為發球者可以選擇採用40：60的混合策略。假如這條直線出現任何傾斜，那麼，它的一端一定落在48％以下。只有在接球者的混合策略為30：70的時候，這條直線才會變成一條水平直線，最小值變成48％。因此，最大值的最小值等於最小值的最大值——48％。

圖7…6發球手攻正手的機率（％）

最小——最大定理的普遍證明相當複雜，不過，其結論卻很有用，應該記住。假如你想知道的只不過是一個選手之得或者另一個選手之失，你只要計算其中一個選手的最佳混合策略並得出結果就行了。

我們的其他工具，比如威廉斯的方法和上述圖表，能夠很好地解決一切只有兩個選手參加且他們各有兩個策略的零和博弈。不幸的是，這些工具並不適用於任何非零和博弈，也不適用於選手數目超過兩個或者他們擁有的策略數目超過兩個的零和博弈。經濟學家和數學家發明了更加普遍的技巧，比如線性規劃方法，可以找出最複雜的零和博弈的均衡策略。雖然這些技巧超出了本書的範圍，我們還是可以利用其中得出的結果。

所有混合策略的均衡具有一個共同點：每個參與者並不在意自己在均衡點的任何具體策略。一旦有必要採取混合策略，找出你自己的均衡混合策略的途徑就在於使別人對他們自己的具體行動無所謂。雖然這聽上去像是一種倒退，其實不然，因為它正好符合零和博弈的隨機化動機：你想阻止別人利用你的有規則的行為佔你的便宜。假如他們確實傾向於採取某一種特別的行動，從你的角度觀察，這隻能表示他們選擇了最糟糕的方針。

說到這裡，我們已經解釋了採取混合或者隨機策略的好處，以及這麼做的策略必要性。基本要點在於，運用偶然性防止別人利用你的有規則的行為佔你的便宜。將這一原理用於實踐則是一個更微妙的間題。下面五個部分可以看做是運用混合策略的迷你指南。

3　．為什麼你應該選擇正確的混合策略？

假如真能發現某個參與者打算採取一種行動方針，而這種行動方針並非其均衡隨機混合策略，另一個參與者就可以利用這一點佔他的便宜。在網球比賽的例子中，當發球者採取自己的均衡策略，按照40：60的比例選擇攻擊對方正手方和反手方時，接球者的成功率為48％。如果發球者採取其他比例，接球者的成功率就會上升。舉個例子：假如發球者很傻，決定把所有的球都發向對方較弱的反手方，接球者由於早有預料，其成功率將會增至60％。一般來說，假如接球者認識發球者，確切瞭解他有什麼癖好，他就能相應採取行動。不過，這麼做永遠存在一種危險，即發球者可能是一個更出色的策略家，好比檯球桌旁的騙子，懂得在無關緊要的時候裝出只會採用糟糕策略的傻樣，引誘對方上當，然後在關鍵時刻發揮本色，打接球者一個措手不及。一旦接球者以為看穿了對方的慣用手法，而放棄自己的均衡混合策略，一心要佔對方便宜，就會上發球者的當。發球者乍看起來很傻的混合策略可能只是一個陷阱。只有採取自己的均衡混合策略才能避免這一危險。

與正確的混合比例一樣重要的是隨機性的本質。假如發球者向接球者正手方發出4個球，然後轉向反手方發出6個球，接著又向正手方發4個球，再向反手方發6個球，如此迴圈，確實可以達到正確的混合比例。不過，這是一種有規則的行為，接球者很快就能洞察其中奧妙。他可以相應做出正確的移動，成功率因此上升為（4/10）90％＋（6/10）60％=72％。發球者若想取得最大效果，必須使每一次發球都不可預測。前面故事裡提到的棒球選手戴克斯特拉與史密斯，似乎沒意識到這個原則。

4　．為什麼不能依賴對手的隨機化？

假如一個參與者選擇的是他的最佳混合策略，那麼，無論對手採取什麼樣的策略，他的成功率都是一樣的。假設你是網球比賽例子裡的接球者，而發球者已經選擇了他的最佳混合策略，即40：60的混合策略。那麼，無論你向正手方還是反手方移動，又或是時而

本站所有小說均來源於會員自主上傳，如侵犯你的權益請聯絡我們，我們會盡快刪除。