?納什均衡 納什均衡是指博弈中這樣的局面,,對(duì)于每個(gè)參與者來說,,只要其他人不改變策略,他就無法改善自己的狀況,。納什證明了在每個(gè)參與者都只有有限種策略選擇并允許混合策略的前提下,,納什均衡定存在。以兩家公司的價(jià)格大戰(zhàn)為例,,價(jià)格大戰(zhàn)存在著兩敗俱傷的可能,,在對(duì)方不改變價(jià)格的條件下既不能提價(jià),否則會(huì)進(jìn)一步喪失市場;也不能降價(jià),因?yàn)闀?huì)出現(xiàn)賠本甩賣,。于是兩家公司可以改變?cè)鹊睦娓窬?,通過談判尋求新的利益評(píng)估分?jǐn)偡桨浮O嗷プ饔玫慕?jīng)濟(jì)主體假定其他主體所選擇的戰(zhàn)略為既定時(shí),,選擇自己的最優(yōu)戰(zhàn)略的狀態(tài),,也就是納什均衡。[1] 中文名 納什均衡 外文名 Nash equilibrium 又稱 非合作博弈均衡 解釋 策略組合 含義 假設(shè)有n個(gè)局中人參與博弈,,如果某情況下無一參與者可以獨(dú)自行動(dòng)而增加收益(即為了自身利益的最大化,,沒有任何單獨(dú)的一方愿意改變其策略的[2]),則此策略組合被稱為納什均衡,。所有局中人策略構(gòu)成一個(gè)策略組合(Strategy Profile),。納什均衡,從實(shí)質(zhì)上說,,是一種非合作博弈狀態(tài),。 納什均衡達(dá)成時(shí),并不意味著博弈雙方都處于不動(dòng)的狀態(tài),,在順序博弈中這個(gè)均衡是在博弈者連續(xù)的動(dòng)作與反應(yīng)中達(dá)成的,。納什均衡也不意味著博弈雙方達(dá)到了一個(gè)整體的最優(yōu)狀態(tài),需要注意的是,,最優(yōu)策略不一定達(dá)成納什均衡,,嚴(yán)格劣勢策略不可能成為最佳對(duì)策,而弱優(yōu)勢和弱劣勢策略是有可能達(dá)成納什均衡的。在一個(gè)博弈中可能有一個(gè)以上的納什均衡,,而囚徒困境中有且只有一個(gè)納什均衡,。 數(shù)學(xué)定義 納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合(s1*,…,,sn*)中,任一博弈方i的策略si*,,都是對(duì)其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,,sn*)的最佳對(duì)策,也即ui(s1*,…s*i-1,si*,s*i+1,…,,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,,sn*)對(duì)任意sij∈Si都成立,則稱(s1*,…,,sn*)為G的一個(gè)納什均衡,。 經(jīng)濟(jì)學(xué)定義 所謂納什均衡,指的是參與人的這樣一種策略組合,,在該策略組合上,,任何參與人單獨(dú)改變策略都不會(huì)得到好處。換句話說,,如果在一個(gè)策略組合上,,當(dāng)所有其他人都不改變策略時(shí),沒有人會(huì)改變自己的策略,,則該策略組合就是一個(gè)納什均衡,。[3] 定理 矩陣博弈中,必定存在一個(gè)混合策略納什均衡,。 分類 納什均衡可以分成兩類:“純戰(zhàn)略納什均衡”和“混合戰(zhàn)略納什均衡”,。 要說明純戰(zhàn)略納什均衡和混合戰(zhàn)略納什均衡,要先說明純戰(zhàn)略和混合戰(zhàn)略,。 所謂純戰(zhàn)略是提供給玩家要如何進(jìn)行賽局的一個(gè)完整的定義,。特別地是,純戰(zhàn)略決定在任何一種情況下要做的移動(dòng),。戰(zhàn)略集合是由玩家能夠施行的純戰(zhàn)略所組成的集合,。而混合戰(zhàn)略是對(duì)每個(gè)純戰(zhàn)略分配一個(gè)機(jī)率而形成的戰(zhàn)略?;旌蠎?zhàn)略允許玩家隨機(jī)選擇一個(gè)純戰(zhàn)略,。混合戰(zhàn)略博弈均衡中要用概率計(jì)算,,因?yàn)槊恳环N策略都是隨機(jī)的,,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)支付最優(yōu),。因?yàn)闄C(jī)率是連續(xù)的,,所以即使戰(zhàn)略集合是有限的,也會(huì)有無限多個(gè)混合戰(zhàn)略,。 當(dāng)然,,嚴(yán)格來說,每個(gè)純戰(zhàn)略都是一個(gè)“退化”的混合戰(zhàn)略,,某一特定純戰(zhàn)略的機(jī)率為 1,,其他的則為 0。 故“純戰(zhàn)略納什均衡”,,即參與之中的所有玩家都玩純戰(zhàn)略,;而相應(yīng)的“混合戰(zhàn)略納什均衡”,之中至少有一位玩家玩混合戰(zhàn)略,。并不是每個(gè)賽局都會(huì)有純戰(zhàn)略納什均衡,,例如“錢幣問題"就只有混合戰(zhàn)略納什均衡,而沒有純戰(zhàn)略納什均衡,。不過,,還是有許多賽局有純戰(zhàn)略納什均衡(如協(xié)調(diào)賽局,囚徒困境和獵鹿賽局),。甚至,,有些賽局能同時(shí)有純戰(zhàn)略和混合戰(zhàn)略均衡。 經(jīng)典案例 囚徒困境 (1950年,,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事,。) 假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事,、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,,對(duì)每一個(gè)犯罪嫌疑人,,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,,于是證據(jù)確鑿,,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,,則兩人各被判刑8年,;如果另一個(gè)犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,,而坦白者有功被減刑8年,,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,,但可以私入民宅的罪名將兩人各判入獄1年,。 ?? 囚徒困境博弈 A╲B 坦白 抵賴 坦白 -8,-8 0,,-10 抵賴 -10,,0 -1,-1 關(guān)于案例,,顯然最好的策略是雙方都抵賴,,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,,首先應(yīng)該是從心理學(xué)的角度來看,,當(dāng)事雙方都會(huì)懷疑對(duì)方會(huì)出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”,,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過程:假如他坦白,,如果我抵賴,,得坐10年監(jiān)獄,如果我坦白最多才8年,;假如他要是抵賴,,如果我也抵賴,我就會(huì)被判一年,,如果我坦白就可以被釋放,,而他會(huì)坐10年牢。綜合以上幾種情況考慮,,不管他坦白與否,,對(duì)我而言都是坦白了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,,最終,,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期,。 基于經(jīng)濟(jì)學(xué)中Rational agent的前提假設(shè),,兩個(gè)囚犯符合自己利益的選擇是坦白招供,原本對(duì)雙方都有利的策略不招供從而均被判處一年就不會(huì)出現(xiàn),。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,,納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場經(jīng)濟(jì)中,,每一個(gè)人都從利己的目的出發(fā),,而最終全社會(huì)達(dá)到利他的效果,。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,,既不利己也不利他,。 硬幣正反 你正在圖書館枯坐,一位陌生美女主動(dòng)過來和你搭訕,,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,,或正或反,。如果我們都是正面,那么我給你3元,,如果我們都是反面,,我給你1元,剩下的情況你給我2元就可以了,?!蹦敲丛摬辉摵瓦@位姑娘玩這個(gè)游戲呢?這基本是廢話,,當(dāng)然該,。問題是,這個(gè)游戲公平嗎,? 每一種游戲依具其規(guī)則的不同會(huì)存在兩種納什均衡,,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),,使得每人都賺得最多或虧得最少,;或者是混合策略納什均衡,而在這個(gè)游戲中,,便應(yīng)該采用混合策略納什均衡,。 你\美女 美女出正面 美女出反面 你出正面 +3,-3 -2,,+2 你出反面 -2,,+2 +1,-1 假設(shè)我們出正面的概率是x,,反面的概率是1-x,,美女出正面的概率是y,反面的概率是1-y,。為了使利益最大化,,應(yīng)該在對(duì)手出正面或反面的時(shí)候我們的收益都相等(不然在這個(gè)游戲中,對(duì)方可以改變正反面出現(xiàn)的概率讓我們的期望收入減少),,由此列出方程就是 3x + (-2)*(1-x)=(-2) * x + 1*( 1-x ) ? 納什均衡 解方程得x=3/8,。 同樣,,美女的收益,列方程 -3y + 2( 1-y)= 2y+ (-1) * ( 1-y) 解得y也等于3/8,,而美女每次的期望收益則是 2(1-y)- 3y = 1/8元,。這告訴我們,在雙方都采取最優(yōu)策略的情況下,,平均每次美女贏1/8元,。 其實(shí)只要美女采取了(3/8,5/8)這個(gè)方案,不論你再采用什么方案,,都是不能改變局面的,。 命名原因 約翰·福布斯·納什(John Forbes Nash Jr)1948年作為年輕數(shù)學(xué)博士生進(jìn)入普林斯頓大學(xué)。其研究成果見于題為《非合作博弈》(1950)的博士論文,。該博士論文導(dǎo)致了《n人博弈中的均衡點(diǎn)》(1950)和題為《非合作博弈》(1951)兩篇論文的發(fā)表,。納什在上述論文中,介紹了合作博弈與非合作博弈的區(qū)別,。他對(duì)非合作博弈的最重要貢獻(xiàn)是闡明了包含任意人數(shù)局中人和任意偏好的一種通用解概念,,也就是不限于兩人零和博弈。該解概念后來被稱為納什均衡,。 ? 納什 納什的主要學(xué)術(shù)貢獻(xiàn)體現(xiàn)在1950年和1951年的兩篇論文,,1950年他才把自己的研究成果寫成題為“非合作博弈”的文章刊登在美國全國科學(xué)院每月公報(bào)上,立即引起轟動(dòng),。說起來這全靠師兄戴維·蓋爾之功,,就在遭到馮·諾依曼貶低,嘲笑幾天之后,,他遇到蓋爾,,像說夢話似的告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”找到了普遍化的方法和均衡點(diǎn)。納什這個(gè)初出茅廬的小子,,根本不知道競爭的險(xiǎn)惡,,從沒想到學(xué)術(shù)欺騙的后果。結(jié)果還是戴維·蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,,起草致科學(xué)院的短信,,系主任列夫謝茨則利用方便的人脈關(guān)系親自將文稿遞交給科學(xué)院。納什寫的文章不多,,他辯解說:少了才是精品,。1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟(jì)學(xué)講座教授時(shí)也沒有發(fā)表過什么文章,特殊的人才,,必須有特殊的選拔辦法,。 Nash平衡是指博弈中這樣的局面,對(duì)于每個(gè)參與者來說,,只要其他人不改變策略,,他就無法改善自己的狀況,。Nash在證明了在每個(gè)參與者都只有有限種策略選擇、并允許混合策略的前提下,,Nash平衡一定存在,。以兩家公司的價(jià)格大戰(zhàn)為例,Nash平衡意味著兩敗俱傷的可能:在對(duì)方不改變價(jià)格的條件下,,既不能提價(jià),,否則會(huì)進(jìn)一步喪失市場;也不能降價(jià),,因?yàn)闀?huì)出現(xiàn)賠本甩賣,。于是兩家公司可以改變?cè)鹊睦娓窬郑ㄟ^談判尋求新的利益評(píng)估分?jǐn)偡桨?,也就是Nash均衡。類似的推理當(dāng)然也可以用到選舉,,群體之間的利益沖突,,潛在戰(zhàn)爭爆發(fā)前的僵局,議會(huì)中的法案爭執(zhí)等,。 重要影響 納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),,正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建?!芬粫囊灾兴f,,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言,、概念等方面,,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融,、會(huì)計(jì),、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域,?!奔{什均衡的重要影響可以概括為以下六個(gè)方面 1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念,、內(nèi)容,、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué),、宏觀經(jīng)濟(jì)學(xué),、勞動(dòng)經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué),、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),,成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵,。 2.?dāng)U展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍,。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析,。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法,、逆推歸納法,、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具,。 3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度,。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡單化處理,,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題,。 4.形成了基于經(jīng)典博弈的研究范式體系,。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。 5.?dāng)U大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué),、自然科學(xué)的聯(lián)系,。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不在,。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存,、運(yùn)動(dòng)和發(fā)展的規(guī)律,。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué),、自然科學(xué)的聯(lián)系更加緊密,,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。 6.改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法,。在進(jìn)化博弈論方面相當(dāng)有造詣的日本經(jīng)濟(jì)學(xué)家神取道宏(Kandori Michihiro,,1997)對(duì)保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,,那就是‘供給’和‘需求’”,,曾做過一個(gè)幽默的引申,,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,,那就是納什均衡
|
|