我很早就明白幾件事,1應(yīng)該對世界施以善意,就算確實存在不懷好意的人;2自己要交付確定性,要靠譜,通常好的戰(zhàn)略都是陽謀,不怕別人知道,甚至希望大家都知道;3永遠不要試探人性。 我只是模模糊糊知道這么做對自己有好處,就算精致利己,毫無善心,為了自己能過得更好,我們也應(yīng)該釋放最大的善意。這本書(《合作的進化》)剖析了其中的道理,面對任何人都選擇善意合作,當遭遇背叛時就跟他斗到底,對方一旦悔改,就原諒他繼續(xù)合作,這就是最好的策略。 書中有一個游戲貫穿始終,“囚徒困境”你和作案伙伴被逮住了,你要選擇揭發(fā)伙伴或者死守秘密。這是個游戲,假設(shè)你們都死守秘密,雙方各加三分,而互相背叛則各得一分,如果你揭發(fā)對方,但他為你死守秘密,你得5分,他得0分 點擊加載圖片 當規(guī)則稍微變化,這個游戲可以和很多對手重復(fù)玩,并且你可以記住對手和他之前的選擇,就變得有意思起來,怎樣策略會得到最高的分數(shù)? 總是背叛、背叛合作交替、完全隨機、合作開始,一旦遭到背叛就一直選擇背叛? 第一次合作,然后復(fù)讀對方的選擇,這樣的一報還一報的策略從中脫穎而出,書中寫了兩次計算機策略競賽,第一次有8個策略參賽。一報還一報得到了最高的分數(shù),而第二次競賽,大家在知道一報還一報的優(yōu)勢后提交策略,一報還一報在總共63個策略的比賽中得到了最高分數(shù)。 我們發(fā)現(xiàn)這個策略能贏下兩輪比賽,并不是靠詭計,想方設(shè)法背叛,贏得比對手更高的分數(shù),仔細思考,一報還一報策略根本沒法得到比對手更高的分數(shù),如果對方愿意一直合作,就可以一直合作下去,得到相等的分數(shù),而反之總是首先遭到背叛,然后就一直會比對手分數(shù)少一點點。他從沒勝過對手,他的勝利依靠引導對方的合作。并且可以和另一個愿意合作的策略相處的很好。而不愿意合作的策略之間常常會互相背叛,他們之間相處的不好。如果我們說一個首先合作的策略是善意的。釋放善意,絕不首先背叛能帶來好處,因為首先背叛會引來對方的報復(fù),這是非常糟糕的局面。 一報還一報的策略非常簡單,以至于其他策略會很快發(fā)現(xiàn),面對一報還一報最好的策略就是一直跟他合作下去,他是可以被激怒的,也是寬容的,可以被激怒讓別人占不了他太多便宜,不讓那些狡猾的策略嘗到甜頭。寬容給了對方背叛后的機會,他接受別人的誠心道歉,在對方嘗試背叛遭到報復(fù)后,沒有陷入只能相互報復(fù)的局面。一報還一報的策略很容易被對方明白,而且對方什么時候明白都不晚,這是一個引導對方和他合作的陽謀。 第二輪比賽中有一個策略是一個狡猾一些的一報還一報,他十分之一的概率首先背叛對方,試探對方是不是可以被激怒,嘗試占一些過于寬容策略的便宜,結(jié)果是他最終和很多策略陷入了相互背叛,在第25次選擇中,他第二次無故背叛了一報還一報,連續(xù)的兩個背叛讓他們陷入了無止盡的背叛中。這個小聰明策略輕視了偶爾背叛的代價,一個單一的背叛會引來一長串的報復(fù),最終陷入無止盡的相互背叛中。而試探人性會讓對方認為你已經(jīng)產(chǎn)生了懷疑,甚至惡意,你的惡意會引來對方的惡意。友誼就在懷疑中消失了。 關(guān)于一報還一報策略的優(yōu)勢就只講這么多,接下來是一些注解。 我們要知道這個策略的一些局限性,它的邊界在哪里? 首先,沒有最好的策略,最好的策略總是根據(jù)環(huán)境變化的,比如 所有對手都是只會背叛的環(huán)境下,最好的策略只能是總是背叛,一次都不讓對手占便宜。 好的策略還受到得分排序的影響,顯而易見當一個背叛的誘惑超過兩個合作時候,交替背叛會有更高的得分。而數(shù)值并不重要,只要四種情況的排序是上述一樣,一報還一報就還是具有優(yōu)勢。在真正的合作中,這個收益甚至不用是對等的,這意味著你的選擇不必可憐對方或者嫉妒對方,只有四種情況的排序是真正重要的。 在囚徒困境中。雙方的選擇沒有絕對輸贏,雙方的利益有一部分是一致的,這不是一個零和博弈。而在零和博弈中,所有的策略都是為了勝過對方,占完所有的好處。生命有限,不要參與任何一場零和博弈。 現(xiàn)在講一個之前一直忽略的問題,重復(fù)囚徒困境,到底重復(fù)多少次。 在有限次的囚徒困境中,假設(shè)5次,顯然 最后一次最好選擇是背叛,于是第四次的選擇不影響第五次的選擇,第四次的背叛不會遭到報復(fù),所以第四次也肯定是背叛。推到第一次也就全是背叛了。所以肯定不能是有限次的,書中的假設(shè)是選擇將越來越不重要,未來收益沒有當下的收益更高,引入一個收益系數(shù),每次選擇都多乘以一個收益系數(shù),假設(shè)收益系數(shù)0.9,那么第一次0.9^ 0,第二次0.9^1 第三次0.9^2.可以想象如果一直合作 可以得到30分,是有確定結(jié)果的。 而我們發(fā)現(xiàn) 當這個收益系數(shù)足夠低的時候,未來可以忽略的時候,那些首先背叛的策略會拿到高分。所以當你希望對方是善意的時候,我們應(yīng)該讓對方相信未來合作的機會是重要的。書里的話更絕“合作的基礎(chǔ)不是真正的信任,而是關(guān)系的持續(xù)性”。我們通過頻繁的接觸讓對方相信,我們還有很大可能性會反復(fù)合作。甚至可以創(chuàng)造這樣頻繁的接觸,我們把一次大的合作拆成很多次小的合作,每一次都很容易達成,并且建立信任。舉例就是想結(jié)婚的人都不是上就談結(jié)婚的。之前都要反復(fù)商量各種問題。 這個游戲能反映一些智慧,但我要說明,這是簡化的,是忽略了一些問題的,1對策者沒有手段可以做出承諾,沒有交流的可能。也不能看見對手和其他策略的對局情況,不能建立信譽,讓對方事先就相信自己的策略。最好的信譽不是一報還一報的信譽,而是惡棍的信譽,有概率選擇合作,但是一旦遭到背叛就永遠背叛。建立這樣的信譽并不容易,他從不原諒別人。2不能放棄對局,這可能是最大的問題,現(xiàn)實中最后的底牌通常是說不,在交易中離場,在關(guān)系中離開,你永遠有說不的權(quán)利。而假設(shè)中忽略了這一點。3對策者不必顧及他人的看法,現(xiàn)實中,部分合作會傷害到他人,商業(yè)勾結(jié)只對參與者有好處;賄賂枉法會讓很多事情變得麻煩。偶爾人們也會反用其中的方法來阻止一些合作。4對方的上一次選擇有時并不確定。現(xiàn)實生活中,有些情況會是一直的欺騙,但是最后才能明白對方一直在選擇欺騙。傳銷和龐氏騙局,一些許諾帶來的錯誤預(yù)期。 盡管如此,一報還一報在計算機競賽中顯示出的優(yōu)勢,還是給我很有價值的啟發(fā): 1、最大的善意 2、交付確定性以引導對方合作 3、不要耍小聰明試探人性 4、引導合作本身就是最好的策略,無關(guān)道德 *[美]羅伯特·阿克塞爾羅德《合作的進化》 點擊加載圖片 點擊加載圖片 點擊加載圖片 |
|
來自: 柳家李紅 > 《形色百態(tài)》