博弈論

歸來(lái)之鷹 2009-04-10

展開(kāi)全文

博弈論又被稱(chēng)為對(duì)策論（Game Theory)，它是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,，也是運(yùn)籌學(xué)的一個(gè)重要組成內(nèi)容,。在《博弈圣經(jīng)》中寫(xiě)到：博弈論是二人在平等的對(duì)局中各自利用對(duì)方的策略變換自己的對(duì)抗策略，達(dá)到取勝的意義,。

博弈論(Game Theory),，有時(shí)也稱(chēng)為對(duì)策論，或者賽局理論,，應(yīng)用數(shù)學(xué)的一個(gè)分支, 目前在生物學(xué),，經(jīng)濟(jì)學(xué)，國(guó)際關(guān)系,，計(jì)算機(jī)科學(xué), 政治學(xué),，軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。主要研究公式化了的激勵(lì)結(jié)構(gòu)（游戲或者博弈（Game)）間的相互作用,。是研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法,。也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。

博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,，并研究它們的優(yōu)化策略,。表面上不同的相互作用可能表現(xiàn)出相似的激勵(lì)結(jié)構(gòu)(incentive structure)，所以他們是同一個(gè)游戲的特例,。其中一個(gè)有名有趣的應(yīng)用例子是囚徒困境悖論(Prisoner's dilemma),。

具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為成為博弈行為。在這類(lèi)行為中,，參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的目標(biāo)或利益,。為了達(dá)到各自的目標(biāo)和利益，各方必須考慮對(duì)手的各種可能的行動(dòng)方案,，并力圖選取對(duì)自己最為有利或最為合理的方案,。比如日常生活中的下棋，打牌等,。博弈論就是研究博弈行為中斗爭(zhēng)各方是否存在著最合理的行為方案,，以及如何找到這個(gè)合理的行為方案的數(shù)學(xué)理論和方法。

生物學(xué)家使用博弈理論來(lái)理解和預(yù)測(cè)進(jìn)化論的某些結(jié)果,。例如,，John Maynard Smith 和George R. Price 在1973年發(fā)表于Nature上的論文中提出的“evolutionarily stable strategy”的這個(gè)概念就是使用了博弈理論。還可以參見(jiàn)進(jìn)化博弈理論（evolutionary game theory）和行為生態(tài)學(xué)（behavioral ecology）,。

博弈論也應(yīng)用于數(shù)學(xué)的其他分支,，如概率,，統(tǒng)計(jì)和線性規(guī)劃等。

博弈論-博弈論的發(fā)展

對(duì)于博弈論的研究,，開(kāi)始于策墨洛(Zermelo,1913),，波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),，后來(lái)

《博弈圣經(jīng)》

由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,，1944，1947)首次對(duì)其系統(tǒng)化和形式化（參照Myerson, 1991）,。隨后約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,，為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。直至《博弈圣經(jīng)》的出現(xiàn),，《博弈圣經(jīng)》與原有博弈論書(shū)籍最大的不同就在于,，獨(dú)創(chuàng)了國(guó)正論、國(guó)正雙贏理論和粒子行為論,，書(shū)中博弈取勝的文化理論統(tǒng)一了人類(lèi)的博弈占優(yōu)行為,。更重要的是，它讓博弈理論終于可以在現(xiàn)實(shí)生活中具體操作,，讓普通大眾通過(guò)研習(xí),，成為真正的博弈高手。因此,，

《博弈圣經(jīng)》中的博弈理論在政治,、經(jīng)濟(jì)、文化,、生活,、娛樂(lè)等社會(huì)的各個(gè)領(lǐng)域具有可應(yīng)用性，并且對(duì)于個(gè)人的工作,、生活也有具體的指導(dǎo)意義,。此外，塞爾頓,、哈桑尼的研究也對(duì)博弈論發(fā)展起到推動(dòng)作用,。今天博弈論已發(fā)展成一門(mén)較完善的的學(xué)科。

博弈論-分類(lèi)

博弈的分類(lèi)根據(jù)不同的基準(zhǔn)也有不同的分類(lèi),。一般認(rèn)為,，博弈主要可以分為合作博弈和非合作博弈。它們的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒(méi)有一個(gè)具有約束力的協(xié)議,，如果有,，就是合作博弈，如果沒(méi)有,，就是非合作博弈,。

從行為的時(shí)間序列性,，博弈論進(jìn)一步分為兩類(lèi)：靜態(tài)博弈是指在博弈中，參與人同時(shí)選擇或雖非同時(shí)選擇但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng),；動(dòng)態(tài)博弈是指在博弈中,，參與人的行動(dòng)有先后順序，且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng),。通俗的理解："囚徒困境"就是同時(shí)決策的,，屬于靜態(tài)博弈；而棋牌類(lèi)游戲等決策或行動(dòng)有先后次序的,，屬于動(dòng)態(tài)博弈

按照參與人對(duì)其他參與人的了解程度分為完全信息博弈和不完全信息博弈,。完全博弈是指在博弈過(guò)程中，每一位參與人對(duì)其他參與人的特征,、策略空間及收益函數(shù)有準(zhǔn)確的信息,。如果參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確,、或者不是對(duì)所有參與人的特征,、策略空間及收益函數(shù)都有準(zhǔn)確的信息，在這種情況下進(jìn)行的博弈就是不完全信息博弈,。

目前經(jīng)濟(jì)學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,，由于合作博弈論比非合作博弈論復(fù)雜，在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論,。非合作博弈又分為：完全信息靜態(tài)博弈,，完全信息動(dòng)態(tài)博弈，不完全信息靜態(tài)博弈,，不完全信息動(dòng)態(tài)博弈,。與上述四種博弈相對(duì)應(yīng)的均衡概念為：納什均衡(Nash equilibrium)，子博弈精煉納什均衡（subgame perfect Nash equilibrium）,，貝葉斯納什均衡(Bayesian Nash equilibrium),，精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

博弈論還又很多分類(lèi),，比如：以博弈進(jìn)行的次數(shù)或者持續(xù)長(zhǎng)短可以分為有限博弈和無(wú)限博弈,；以表現(xiàn)形式也可以分為一般型（戰(zhàn)略型）或者展開(kāi)型，等等,。

博弈論-意義

博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會(huì)經(jīng)濟(jì)現(xiàn)象的學(xué)科一樣,，都是從復(fù)雜的現(xiàn)象中抽象出基本的元素，對(duì)這些元素構(gòu)成的數(shù)學(xué)模型進(jìn)行分析,，而后逐步引入對(duì)其形勢(shì)產(chǎn)影響的其他因素,，從而分析其結(jié)果。

基于不同抽象水平,，形成三種博弈表述方式,，標(biāo)準(zhǔn)型,、擴(kuò)展型和特征函數(shù)型利用這三種表述形式,可以研究形形色色的問(wèn)題。因此,它被稱(chēng)為“社會(huì)科學(xué)的數(shù)學(xué)”從理論上講,，博弈論是研究理性的行動(dòng)者相互作用的形式理論,，而實(shí)際上正深入到經(jīng)濟(jì)學(xué)、政治學(xué),、社會(huì)學(xué)等等,，被各門(mén)社會(huì)科學(xué)所應(yīng)用。

博弈論與納什平衡
博弈論（game theory）對(duì)人的基本假定是：人是理性的（rational,，或者說(shuō)自私的）,理性的人是指他在具體策略選擇時(shí)的目的是使自己的利益最大化,，博弈論研究的是理性的人之間如何進(jìn)行策略選擇的,。

納什（John Nash）編制的博弈論經(jīng)典故事"囚徒的困境",，說(shuō)明了非合作博弈及其均衡解的成立，故稱(chēng)"納什平衡",。

所有的博弈問(wèn)題都會(huì)遇到三個(gè)要素,。在囚徒的故事中，兩個(gè)囚徒是當(dāng)事人(players)又稱(chēng)參與者,；當(dāng)事人所做的選擇策略 (strategies)是承認(rèn)了殺人事實(shí),，最后兩個(gè)人均贏得(payoffs)了中間的宣判結(jié)果。如果兩個(gè)囚徒之中有一個(gè)承認(rèn)殺人,，另外一個(gè)抵賴,，不承認(rèn)殺人，那么承認(rèn)者將會(huì)得到減刑處理,，而抵賴者將會(huì)得到最嚴(yán)厲的死刑判決,，在納什故事中兩個(gè)人都承認(rèn)了犯罪事實(shí)，所以兩個(gè)囚徒得到的是中間的結(jié)果,。

類(lèi)似的：我們也能從“自私的基因”等理論中看到“納什平衡”的體現(xiàn),。

在互聯(lián)網(wǎng)這個(gè)原始叢林中：最優(yōu)策略是如何產(chǎn)生的呢？

博弈中最優(yōu)策略的產(chǎn)生
艾克斯羅德（Robert Axelrod）在開(kāi)始研究合作之前,，設(shè)定了兩個(gè)前提：一,、每個(gè)人都是自私的；二,、沒(méi)有權(quán)威干預(yù)個(gè)人決策,。也就是說(shuō)，個(gè)人可以完全按照自己利益最大化的企圖進(jìn)行決策,。在此前提下,，合作要研究的問(wèn)題是：第一、人為什么要合作,；第二,、人什么時(shí)候是合作的,，什么時(shí)候又是不合作的；第三,、如何使別人與你合作,。

社會(huì)實(shí)踐中有很多合作的問(wèn)題。比如國(guó)家之間的關(guān)稅報(bào)復(fù),，對(duì)他國(guó)產(chǎn)品提高關(guān)稅有利于保護(hù)本國(guó)的經(jīng)濟(jì),，但是國(guó)家之間互提關(guān)稅，產(chǎn)品價(jià)格就提高了,，喪失了競(jìng)爭(zhēng)力,，損害了國(guó)際貿(mào)易的互補(bǔ)優(yōu)勢(shì)。在對(duì)策中,，由于雙方各自追求自己利益的最大化,，導(dǎo)致了群體利益的損害。對(duì)策論以著名的囚犯困境來(lái)描述這個(gè)問(wèn)題,。

A和B各表示一個(gè)人,，他們的選擇是完全無(wú)差異的。選擇C代表合作,，選擇D代表不合作,。如果AB都選擇C合作，則兩人各得3分,；如果一方選C,，一方選D，則選C的得零分,，選D的得5分,；如果AB都選D，雙方各得1分,。

顯然,，對(duì)群體來(lái)說(shuō)最好的結(jié)果是雙方都選C，各得3分,，共得6分,。如果一方選C，一方選D,，總體得5分,。如果兩人都選D，總體得2分,。

對(duì)策學(xué)界用這個(gè)矩陣來(lái)描述個(gè)體理性與群體理性的沖突：每個(gè)人在追求個(gè)體利益最大化時(shí),，就使群體利益受損，這就是囚徒困境。在矩陣中,，對(duì)于A來(lái)說(shuō),，當(dāng)對(duì)方選 C，他選D得5分,，選C只得3分,；當(dāng)對(duì)方選D，他選D得1分,，選C得零分,。因此，無(wú)論對(duì)方選C或D,，對(duì)A來(lái)說(shuō),，選D都得分最多。這是A單方面的優(yōu)超策略,。而當(dāng)兩個(gè)優(yōu)超策略相遇,，即A，B都選D時(shí),，結(jié)果是各得1分,。這個(gè)結(jié)果在矩陣中并非最優(yōu)。困境就在于,，每個(gè)人采取各自的優(yōu)超策略時(shí)，得出的解是穩(wěn)定的,，但不是帕累托最優(yōu)的,，這個(gè)結(jié)果體現(xiàn)了個(gè)體理性與群體理性的矛盾。在數(shù)學(xué)上,，這個(gè)一次性決策的矩陣沒(méi)有最優(yōu)解,。

如果博弈進(jìn)行多次，只要對(duì)策者知道博弈次數(shù),，他們?cè)谧詈笠淮慰隙ú扇』ハ啾撑训牟呗?。既然如此，前面的每一次也就沒(méi)有合作的必要,，因此,，在次數(shù)已知的多次博弈中，對(duì)策者沒(méi)有一次會(huì)合作,。

如果博弈在多人間進(jìn)行,，而且次數(shù)未知，對(duì)策者就會(huì)意識(shí)到,，當(dāng)持續(xù)地采取合作并達(dá)成默契時(shí),，對(duì)策者就能持續(xù)地各3分，但如果持續(xù)地不合作的話，每個(gè)人就永遠(yuǎn)得1分,。這樣,，合作的動(dòng)機(jī)就顯現(xiàn)出來(lái)。多次對(duì)局下,，未來(lái)的收益應(yīng)比現(xiàn)在的收益多一個(gè)折現(xiàn)率W,，W 越大，表示未來(lái)的收益越重要,。在多人對(duì)策持續(xù)進(jìn)行下去,，且W比較大，即未來(lái)充分重要時(shí),，最優(yōu)的策略是與別人采取的策略有關(guān)的,。假設(shè)某人的策略是，第一次合作,，以后只要對(duì)方不合作一次,，他就永不合作。對(duì)這種對(duì)策者,，當(dāng)然合作下去是上策,。假如有的人不管對(duì)方采取什么策略，他總是合作,，那么總是對(duì)他采取不合作的策略得分最多,。對(duì)于總是不合作的人，也只能采取不合作的策略,。

艾克斯羅德做了一個(gè)實(shí)驗(yàn),，邀請(qǐng)多人來(lái)參加游戲，得分規(guī)則與前面的矩陣相同,，什么時(shí)候結(jié)束游戲是未知的,。他要求每個(gè)參賽者把追求得分最多的策略寫(xiě)成計(jì)算機(jī)程序，然后用單循環(huán)賽的方式將參賽程序兩兩博弈,，以找出什么樣的策略得分最高,。

第一輪游戲有14個(gè)程序參加，再加上艾克斯羅德自己的一個(gè)隨機(jī)程序(即以50%的概率選取合作或不合作),，運(yùn)轉(zhuǎn)了300次,。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫(xiě)的"一報(bào)還一報(bào)"(tit for tat)。這個(gè)程序的特點(diǎn)是,，第一次對(duì)局采用合作的策略,，以后每一步都跟隨對(duì)方上一步的策略，你上一次合作,，我這一次就合作,，你上一次不合作,，我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),，得分排在前面的程序有三個(gè)特點(diǎn)：第一,，從不首先背叛，即"善良的",；第二,，對(duì)于對(duì)方的背叛行為一定要報(bào)復(fù)，不能總是合作,，即" 可激怒的",；第三，不能人家一次背叛,，你就沒(méi)完沒(méi)了的報(bào)復(fù),，以后人家只要改為合作，你也要合作,，即"寬容性",。

為了進(jìn)一步驗(yàn)證上述結(jié) 論，艾氏決定邀請(qǐng)更多的人再做一次游戲,，并把第一次的結(jié)果公開(kāi)發(fā)表,。第二次征集到了62個(gè)程序，加上他自己的隨機(jī)程序,，又進(jìn)行了一次競(jìng)賽,。結(jié)果，第一名的仍是"一報(bào)還一報(bào)",。艾氏總結(jié)這次游戲的結(jié)論是：第一,，"一報(bào)還一報(bào)"仍是最優(yōu)策略。第二,，前面提到的三個(gè)特點(diǎn)仍然有效，因?yàn)?3人中的前15名里,，只有第8名的哈靈頓程序是"不善良的",，后15名中，只有1個(gè)總是合作的是"善良的",?？杉づ院蛯捜菪砸驳玫搅俗C明。此外,，好的策略還必須具有的一個(gè)特點(diǎn) 是"清晰性",，能讓對(duì)方在三、五步對(duì)局內(nèi)辨識(shí)出來(lái),，太復(fù)雜的對(duì)策不見(jiàn)得好,。"一報(bào)還一報(bào)"就有很好的清晰性，讓對(duì)方很快發(fā)現(xiàn)規(guī)律，從而不得不采取合作的態(tài) 度,。

博弈論-合作的進(jìn)行過(guò)程及規(guī)律

"一報(bào)還一報(bào)"的策略在靜態(tài)的群體中得到了很好的分?jǐn)?shù),，那么，在一個(gè)動(dòng)態(tài)的進(jìn)化的群體中,，這種合作者能否產(chǎn)生,、發(fā)展、生存下去呢,？群體是會(huì)向合作的方向進(jìn)化,，還是向不合作的方向進(jìn)化？如果大家開(kāi)始都不合作,，能否在進(jìn)化過(guò)程中產(chǎn)生合作,？為了回答這些疑問(wèn)，艾氏用生態(tài)學(xué)的原理來(lái)分析合作的進(jìn)化過(guò)程,。

假設(shè)對(duì)策者所組成的策略群體是一代一代進(jìn)化下去的,，進(jìn)化的規(guī)則包括：一，試錯(cuò),。人們?cè)趯?duì)待周?chē)h(huán)境時(shí),，起初不知道該怎么做，于是就試試這個(gè),，試試那個(gè),，哪個(gè)結(jié)果好就照哪個(gè)去做。第二,，遺傳,。一個(gè)人如果合作性好，他的后代的合作基因就多,。第三,，學(xué)習(xí)。比賽過(guò)程就是對(duì)策者相互學(xué)習(xí)的過(guò)程,，"一報(bào)還一報(bào)"的策略好,，有的人就愿意學(xué)。按這樣的思路,，艾氏設(shè)計(jì)了一個(gè)實(shí)驗(yàn),，假設(shè)63個(gè)對(duì)策者中，誰(shuí)在第一輪中的得分高,，他在第二輪的群體中所占比例就越高,，而且是他的得分的正函數(shù)。這樣,，群體的結(jié)構(gòu)就會(huì)在進(jìn)化過(guò)程中改變,，由此可以看出群體是向什么方向進(jìn)化的,。

實(shí)驗(yàn)結(jié)果很有趣。"一報(bào)還一報(bào)"原來(lái)在群體中占 1/63,，經(jīng)過(guò)1000代的進(jìn)化,，結(jié)構(gòu)穩(wěn)定下來(lái)時(shí)，它占了24%,。另外,，有一些程序在進(jìn)化過(guò)程中消失了。其中有一個(gè)值得研究的程序,，即原來(lái)前15名中唯一的那個(gè)"不善良的"哈靈頓程序,，它的對(duì)策方案是，首先合作,，當(dāng)發(fā)現(xiàn)對(duì)方一直在合作,，它就突然來(lái)個(gè)不合作，如果對(duì)方立刻報(bào)復(fù)它,，它就恢復(fù)合作,，如果對(duì)方仍然合作，它就繼續(xù)背叛,。這個(gè)程序一開(kāi)始發(fā)展很快,，但等到除了"一報(bào)還一報(bào)"之外的其它程序開(kāi)始消失時(shí)，它就開(kāi)始下降了,。因此,，以合作系數(shù)來(lái)測(cè)量，群體是越來(lái)越合作的,。

進(jìn)化實(shí)驗(yàn)揭示了一個(gè)哲理：一個(gè)策略的成功應(yīng)該以對(duì)方的成功為基礎(chǔ),。"一報(bào)還一報(bào)"在兩個(gè)人對(duì)策時(shí)，得分不可能超過(guò)對(duì)方,，最多打個(gè)平手,，但它的總分最高。它賴以生存的基礎(chǔ)是很牢固的,，因?yàn)樗寣?duì)方得到了高分,。哈靈頓程序就不是這樣，它得到高分時(shí),，對(duì)方必然得到低分。它的成功是建立在別人失敗的基礎(chǔ)上的,，而失敗者總是要被淘汰的,，當(dāng)失敗者被淘汰之后，這個(gè)好占別人便宜的成功者也要被淘汰,。

那么,，在一個(gè)極端自私者所組成的不合作者的群體中,，"一報(bào)還一報(bào)"能否生存呢？艾氏發(fā)現(xiàn),，在得分矩陣和未來(lái)的折現(xiàn)系數(shù)一定的情況下,，可以算出，只要群體的 5%或更多成員是"一報(bào)還一報(bào)"的,，這些合作者就能生存,，而且，只要他們的得分超過(guò)群體的總平均分,，這個(gè)合作的群體就會(huì)越來(lái)越大,，最后蔓延到整個(gè)群體。反之,，無(wú)論不合作者在一個(gè)合作者占多數(shù)的群體中有多大比例,，不合作者都是不可能自下而上的。這就說(shuō)明,，社會(huì)向合作進(jìn)化的棘輪是不可逆轉(zhuǎn)的,，群體的合作性越來(lái) 越大。艾克斯羅德正是以這樣一個(gè)鼓舞人心的結(jié)論,，突破了"囚犯困境"的研究困境,。

在研究中發(fā)現(xiàn)，合作的必要條件是：第一,、關(guān)系要持續(xù),，一次性的或有限次的博弈中，對(duì)策者是沒(méi)有合作動(dòng)機(jī)的,；第二,、對(duì)對(duì)方的行為要做出回報(bào)，一個(gè)永遠(yuǎn)合作的對(duì)策者是不會(huì)有人跟他合作的,。

那么,，如何提高合作性呢？首先,，要建立持久的關(guān)系,，即使是愛(ài)情也需要建立婚姻契約以維持雙方的合作。（火車(chē)站的小販為什么要騙人,？為什么工作中要形成小組制度,？換防的時(shí)候一方總是要小小地進(jìn)攻一下的，在中越前線就是這樣）第二,、要增強(qiáng)識(shí)別對(duì)方行動(dòng)的能力,，如果不清楚對(duì)方是合作還是不合作，就沒(méi)法回報(bào)他了,。第三,、要維持聲譽(yù),，說(shuō)要報(bào)復(fù)就一定要做到，人家才知道你是不好欺負(fù)的,，才不敢不與你合作,。第四、能夠分步完成的對(duì)局不要一次完成,，以維持長(zhǎng)久關(guān)系,，比如，貿(mào)易,、談判都要分步進(jìn)行,，以促使對(duì)方采取合作態(tài)度。第五,、不要嫉妒人家的成功,，"一報(bào)還一報(bào)"正是這樣的典范。第六,、不要首先背叛,，以免擔(dān)上罪魁禍?zhǔn)椎牡赖聣毫Α５谄?、不僅對(duì)背叛要回報(bào),，對(duì)合作也要作出回報(bào)。第八,、不要耍小聰明,，占人家便宜。

艾克斯羅德在《合作的進(jìn)化》一書(shū)結(jié)尾提出幾個(gè)結(jié)論,。第一,、友誼不是合作的必要條件，即使是敵人,，只要滿足了關(guān)系持續(xù),，互相回報(bào)的條件，也有可能合作,。比如,，第一次世界大戰(zhàn)期間，德英兩軍在戰(zhàn)壕戰(zhàn)中遇上了三個(gè)月的雨季,，雙方在這三個(gè)月中達(dá)成了默契,，互相不攻擊對(duì)方的糧車(chē)給養(yǎng)，到大反攻時(shí)再你死我活地打,。這個(gè)例子說(shuō)明,，友誼不是合作的前提。第二、預(yù)見(jiàn)性也不是合作的前提,，艾氏舉出生物界低等動(dòng)物、植物之間合作的例子來(lái)說(shuō)明這一點(diǎn),。但是,，當(dāng)有預(yù)見(jiàn)性的人類(lèi)了解了合作的規(guī)律之后，合作進(jìn)化的過(guò)程就會(huì)加快,。這時(shí),，預(yù)見(jiàn)性是有用的，學(xué)習(xí)也是有用的,。

當(dāng)游戲中考慮到隨機(jī)干擾,，即對(duì)策者由于誤會(huì)而開(kāi)始互相背叛的情形時(shí)，吳堅(jiān)忠博士經(jīng)研究發(fā)現(xiàn),，以修正的"一報(bào)還一報(bào)",，即以一定的概率不報(bào)復(fù)對(duì)方的背叛，和 "悔過(guò)的一報(bào)還一報(bào)",，即以一定的概率主動(dòng)停止背叛,。群體所有成員處理隨機(jī)環(huán)境的能力越強(qiáng)，"悔過(guò)的一報(bào)還一報(bào)"效果越好,，"寬大的一報(bào)還一報(bào)"效果越差,。

博弈論-艾克斯羅德的貢獻(xiàn)與局限性

艾克斯羅德通過(guò)數(shù)學(xué)化和計(jì)算機(jī)化的方法研究如何突破囚徒困境，達(dá)成合作,，將這項(xiàng)研究帶到了一個(gè)全新境界,，他在數(shù)學(xué)上的證明無(wú)疑是十分雄辯和令人信服的，而且,，他在計(jì)算機(jī)模擬中得出的一些結(jié)論是非常驚人的發(fā)現(xiàn),，比如，總分最高的人在每次博弈中都沒(méi)有拿到最高分,。（劉邦和項(xiàng)羽的戰(zhàn)爭(zhēng)）

艾氏所發(fā)現(xiàn)的"一報(bào)還一報(bào)"策略,，從社會(huì)學(xué)的角度可以看作是一種"互惠式利他"，這種行為的動(dòng)機(jī)是個(gè)人私利,，但它的結(jié)果是雙方獲利,，并通過(guò)互惠式利他有可能覆蓋了范圍最廣的社會(huì)生活，人們通過(guò)送禮及回報(bào),，形成了一種社會(huì)生活的秩序,，這種秩序即使在多年隔絕，語(yǔ)言不通的人群之間也是最易理解的東西,。比如,，哥倫布登上美洲大陸時(shí)，與印地安人最初的交往就開(kāi)始于互贈(zèng)禮物,。有些看似純粹的利他行為,，比如無(wú)償損贈(zèng),，也通過(guò)某些間接方式，比如社會(huì)聲譽(yù)的獲得,，得到了回報(bào),。研究這種行為，將對(duì)我們理解社會(huì)生活有很重要的意義,。

囚徒困境擴(kuò)展為多人博弈時(shí),，就體現(xiàn)了一個(gè)更廣泛的問(wèn)題──"社會(huì)悖論"，或"資源悖論",。人類(lèi)共有的資源是有限的,，當(dāng)每個(gè)人都試圖從有限的資源中多拿一點(diǎn)兒時(shí)，就產(chǎn)生了局部利益與整體利益的沖突,。人口問(wèn)題,、資源危機(jī)、交通阻塞,，都可以在社會(huì)悖論中得以解釋?zhuān)谶@些問(wèn)題中,，關(guān)鍵是通過(guò)研究，制定游戲規(guī)則來(lái)控制每個(gè)人的行為,。

艾克斯羅德的一些結(jié)論在中國(guó)古典文化道德傳統(tǒng)中可以很容易地找到對(duì)應(yīng),，"投桃報(bào)李"、"人不犯我,，我不犯人"都體現(xiàn)了"tit for tat"的思想,。但這些東西并不是最優(yōu)的，因?yàn)?一報(bào)還一報(bào)"在充滿了隨機(jī)性的現(xiàn)實(shí)社會(huì)生活里是有缺陷的,。對(duì)此,，孔子在幾千年前就說(shuō)出了"以德報(bào)德，以直報(bào)怨"這樣精彩的修正策略,，所謂"直",，就是公正，以公正來(lái)回報(bào)對(duì)方的背叛,，是一種修正了的"一報(bào)還一報(bào)",，修正的是報(bào)復(fù)的程度，本來(lái)會(huì)讓你損失5分,，現(xiàn) 在只讓你損失3分,，從而以一種公正審判來(lái)結(jié)束代代相續(xù)的報(bào)復(fù)，形成文明,。

但是,，艾氏對(duì)博弈者的一些假設(shè)和結(jié)論使其研究不可避免地與現(xiàn) 實(shí)脫節(jié)。首先，《合作的進(jìn)化》一書(shū)暗含著一個(gè)重要的假定,，即,，個(gè)體之間的博弈是完全無(wú)差異的。現(xiàn)實(shí)的博弈中,，對(duì)策者之間絕對(duì)的平等是不可能達(dá)到的,。一方面，對(duì)策者在實(shí)際的實(shí)力上有差異,，雙方互相背叛時(shí)，可能不是各得1分,，而是強(qiáng)者得5分,，弱者得0分，這樣,，弱者的報(bào)復(fù)就毫無(wú)意義,。另一方面，即使對(duì)局雙方確實(shí)旗鼓相當(dāng),，但某一方可能懷有賭徒心理,，認(rèn)定自己更強(qiáng)大，采取背叛的策略能占便宜,。艾氏的得分矩陣忽視了這種情形,，而這種賭徒心理恰恰在社會(huì)上大量引發(fā) 了零和博弈。因此,，程序還可以在此基礎(chǔ)上進(jìn)一步改進(jìn),。

其次，艾氏認(rèn)為合作不需預(yù)期和信任,。這是他受到質(zhì)疑頗多之處,。對(duì)策者根據(jù)對(duì)方前面的戰(zhàn)術(shù)來(lái)制定自己下面的戰(zhàn)術(shù)，合作要求個(gè)體能夠識(shí)別那些曾經(jīng)相遇過(guò)的個(gè)體并且記得與其相互作用的歷史,，以便作出反應(yīng),，這些都暗含著"預(yù)期"行為。在應(yīng)付復(fù)雜的對(duì)策環(huán)境時(shí),，信任可能是對(duì)局雙方達(dá)成合作的必不可少的環(huán)節(jié),。但是，預(yù)期與信任如何在計(jì)算機(jī)的程序中體現(xiàn)出來(lái),，仍是需要研究的,。

最后，重復(fù)博弈在現(xiàn)實(shí)中是很難完全實(shí)現(xiàn)的,。一次性博弈的大量存在,，引發(fā)了很多不合作的行為，而且，對(duì)策的一方在遭到對(duì)方背叛之后,，往往沒(méi)有機(jī)會(huì)也沒(méi)有還手之力去進(jìn)行報(bào)復(fù),。比如，資本積累階段的違約行為,，國(guó)家之間的核威懾,。在這些情況下，社會(huì)要使交易能夠進(jìn)行,，并且防止不合作行為,，必須通過(guò)法制手段，以法律的懲罰代替?zhèn)€人之間的"一報(bào)還一報(bào)",，規(guī)范社會(huì)行為,。這是艾克斯羅德的研究對(duì)制度學(xué)派的一個(gè)重要啟發(fā)。

博弈論-考考文獻(xiàn)

經(jīng)濟(jì)學(xué)高級(jí)學(xué)術(shù)著作《博弈圣經(jīng)》http://www.
Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0691011931
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
Osborne, M. and A. Rubinstein,，1994,，A Course in Game Theory, Cambridge and London: The MIT Press.
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0465021212
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0691015678
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0393974219
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3492021514
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0415250951
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0521814626
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3528032146

→ 如果您認(rèn)為本詞條還有待完善,請(qǐng) 編輯詞條收藏詞條至個(gè)人空間

本詞條內(nèi)容有價(jià)值 1 互動(dòng)百科的詞條資料來(lái)自網(wǎng)友貢獻(xiàn)，供您查閱參考,，一些和您切身相關(guān)的具體問(wèn)題（特別是健康,、經(jīng)濟(jì)、法律相關(guān)問(wèn)題）,，出于審慎起見(jiàn),，建議咨詢專(zhuān)業(yè)人士以獲得更有針對(duì)性的答案。

馮·諾伊曼

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào),。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：歸來(lái)之鷹 > 《我的圖書(shū)館》

舉報(bào)/認(rèn)領(lǐng)