久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

那些悼念納什的人,,你們真的懂NASH嗎

 真友書屋 2015-05-26

我們可以毫無疑問地說,,納什均衡是非合作博弈論解概念大廈的基石,,迄今為止,,幾乎所有因博弈論獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的理論貢獻(xiàn)都與納什的工作有一定的關(guān)聯(lián),。


【不朽的名字屬于NASH】

5月24日,,一個(gè)令人震驚的沉痛消息傳來,,著名的博弈論大師和天才數(shù)學(xué)家約翰·納什“剛從挪威領(lǐng)取阿貝爾獎(jiǎng)(Abel Prize),,返抵美國后由機(jī)場(chǎng)乘出租車返家,誰料因此不幸遇難”,。相比二十幾歲早逝的偉大數(shù)學(xué)家阿貝爾,,納什的一生經(jīng)歷尤為曲折跌宕。但,,他與阿貝爾(挪威著名數(shù)學(xué)家)一樣,,“斯人已逝、英名不朽”,。

博弈論作為關(guān)于“理性人的互動(dòng)行為”的理論,,已經(jīng)發(fā)展成為分析理性決策者在策略互動(dòng)局勢(shì)下的行為選擇模式的標(biāo)準(zhǔn)工具。可以說,,博弈論在今天的社會(huì)科學(xué)體系中起著社會(huì)物理學(xué)的作用,,成為幾乎所有社會(huì)科學(xué)的語言,。

而納什所提出的策略均衡解的概念和思想,是博弈論的核心與基礎(chǔ),。他對(duì)博弈論的偉大貢獻(xiàn)至少包括如下四個(gè)方面:給出納什均衡的形式定義,,并證明其存在性;對(duì)二人討價(jià)還價(jià)問題進(jìn)行公理刻畫并得到納什談判解,;提出探尋非合作博弈與合作博弈之間關(guān)系的納什規(guī)劃(Nash Program) ,;開啟關(guān)于博弈論基礎(chǔ)的研究的大門。


【納什均衡】

在《20世紀(jì)數(shù)學(xué)的五大指導(dǎo)理論》中,,卡斯蒂把馮·諾伊曼的最小最大定理列為其中的第一個(gè),,而在第一章的中間引入了作為其推廣的納什均衡存在性定理。這兩個(gè)定理在博弈論發(fā)展史中起著里程碑式的巨大影響,,尤其納什的定理被視為博弈論的基本定理,,也是他1994年與豪爾紹尼、賽爾頓同獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的主要原因,。

一個(gè)博弈就是策略互動(dòng)情形的刻畫,,包括博弈者、他們可選擇的行動(dòng)集合,、他們行動(dòng)的先后順序,,他們?cè)诓┺倪M(jìn)行到不同階段所掌握的信息,他們的各種行動(dòng)組合導(dǎo)致的結(jié)果以及每個(gè)人對(duì)結(jié)果的評(píng)價(jià),;而博弈的解就是對(duì)一類博弈能夠如何進(jìn)行并產(chǎn)生何種結(jié)果的刻畫,。

馮·諾伊曼1928年(巧合的是納什在這一年出生)關(guān)于二人零和博弈的“最小最大定理”是博弈論解概念的第一個(gè)基礎(chǔ)性貢獻(xiàn),如果兩個(gè)人進(jìn)行一項(xiàng)零和博弈(即常和博弈,,你之所得為我之所失),,那么雙方都存在一個(gè)可能是混合策略的行動(dòng)方案使得:你針對(duì)我的每一個(gè)策略而選擇恰當(dāng)?shù)膽?yīng)對(duì)而產(chǎn)生我的一組最小支付,然后由我選擇相應(yīng)的對(duì)策而得到其中的最大值,,這個(gè)值就等于,,我針對(duì)你的每一個(gè)策略而選擇恰當(dāng)?shù)膽?yīng)對(duì)而產(chǎn)生的一組最大支付,然后由你選擇相應(yīng)的對(duì)策而得到其中的最小值,。用馮·諾伊曼自己的話說,,如果沒有最小最大定理,也許就沒有博弈論,。

但是,,對(duì)于范圍更大的非零和博弈,這個(gè)定理并不成立,。在馮·諾伊曼和摩根斯頓合著的巨作《博弈論與經(jīng)濟(jì)行為》中,對(duì)任何非零和博弈,,通過引入虛擬的參與者——自然,,把N人非零和博弈轉(zhuǎn)化為N+1人的零和博弈,,但這種變換的社會(huì)科學(xué)含義并不清晰,因而問題依然存在,。這樣納什的工作就登堂入室了,。

在普林斯頓大學(xué)的博士學(xué)位論文(除了附錄的大部分1951年發(fā)表于《數(shù)學(xué)年刊》)中,納什引入了以其名字命名的策略均衡并運(yùn)用布勞威爾不動(dòng)點(diǎn)定理,,證明其在任何有限博弈(參與者集合與每個(gè)參與者的行動(dòng)集合都是有限的)中的存在性,。

納什均衡的原始思想和概念可以追溯到法國經(jīng)濟(jì)學(xué)家古諾對(duì)雙寡頭競(jìng)爭的分析(Cournaut,1838),,但是納什給出了一般情形下的定義,,即,一個(gè)行動(dòng)組合(嚴(yán)格來說是策略組合):在其他人不改變行動(dòng)的情況下,,每個(gè)人都沒有動(dòng)力單方面偏離而選擇其他行動(dòng)(定義中隱含地假設(shè)博弈者們獨(dú)立選擇行動(dòng),,如果允許他們之間存在某種相關(guān)性,則可得到奧曼提出的相關(guān)均衡),。換句話說,,所有參與人的行動(dòng)互為最優(yōu)的應(yīng)對(duì)。

愛好武俠小說的朋友可以想象一下,,兩個(gè)武功高手以內(nèi)力比拼的僵局,,他們誰也不能撤回自己的掌力,這就形成一個(gè)納什均衡,。

我們也可以用一個(gè)囚徒困境博弈的翻版來說明納什均衡,。假想在一個(gè)法治不是特別健全的社會(huì)里,原被告打一場(chǎng)100萬的官司,,每個(gè)人都可以選擇以30萬金額賄賂法官或不賄賂(簡單起見,,我們假設(shè)只有這兩種行動(dòng))。如果都不賄賂,,那么法官會(huì)給出一個(gè)基本公正的裁定:原告60萬,,被告40萬;但如果有一個(gè)人賄賂而對(duì)方?jīng)]有,,自然是沒有賄賂的倒了大霉,,一分也拿不到;當(dāng)然如果兩個(gè)人都賄賂了法官,,那么兩下里扯平,,他該怎么判就怎么判。

這個(gè)博弈中的原告和被告,,都有一個(gè)占優(yōu)策略(看過《射雕英雄傳》的人可以記起,,郭靖如何用剛學(xué)到的亢龍有悔這一招對(duì)付梁子翁),即不管其對(duì)手如何選擇,他選擇賄賂帶來的結(jié)果要更好,。所以,,博弈的結(jié)局就是,他們兩個(gè)都會(huì)理性地選擇賄賂法官(這個(gè)行動(dòng)組合也構(gòu)成納什均衡),,然后出現(xiàn)前些年民謠里的結(jié)果:大蓋帽,,兩頭翹,吃了原告吃被告,。

這個(gè)博弈也提示我們,,理性的人玩出的結(jié)果也許是集體“非理性”,因?yàn)椋ú?,不)的結(jié)果帕雷托優(yōu)超于(賄賂,,賄賂)。一個(gè)結(jié)果帕雷托優(yōu)超另一個(gè)結(jié)果,,是說從后者到前者沒有人受損,,但至少有一個(gè)人受益,所以我們很難從直覺上否認(rèn)前者好過后者,。




納什均衡是否一定給出一個(gè)博弈合理進(jìn)行的建議或預(yù)見呢,?Kreps曾給出一個(gè)例子,其中納什均衡所指派的策略太不合理,。兩個(gè)人同時(shí)選擇X或Y,。若同時(shí)選擇X,則各得支付1,;若一人選X,,另一人選Y,則前者得1,,后者得0,;若同時(shí)選擇Y,則進(jìn)入一個(gè)報(bào)整數(shù)比賽,。大者得250,,小者得100。如果所報(bào)數(shù)字相同,,則各得25,。顯然,此博弈的子博弈完美均衡是兩人同時(shí)選擇X,,各得支付1,。但是,他們?yōu)槭裁床煌瑫r(shí)選擇Y而進(jìn)入報(bào)整數(shù)比賽呢,?其中最差的結(jié)果也是遠(yuǎn)遠(yuǎn)好于1的25,。原因只是,這個(gè)報(bào)整數(shù)的子博弈由于純策略是無限多的而導(dǎo)致沒有納什均衡存在。如果加上有限性的限制,,問題會(huì)自然解決,。

納什均衡的思想非常簡單又美妙,。如博弈論的經(jīng)典之一《博弈和決策》的作者盧斯和萊法所指出:“如果我們的非合作理論導(dǎo)致一個(gè)策略選擇的組合,,并且它具有這樣的性質(zhì),即關(guān)于理論的知識(shí)不會(huì)導(dǎo)致一個(gè)人做出一個(gè)不同于理論預(yù)見到的選擇,,那么理論剝離出來的策略一定是均衡點(diǎn),。”

當(dāng)然,,這并不意味著納什均衡是博弈論的終結(jié),。實(shí)際上,與納什同時(shí)獲獎(jiǎng)的豪爾紹尼就把它推廣到處理信息不完全情形的貝葉斯博弈,;而賽爾頓則表明一個(gè)博弈中并不是所有的納什均衡都有道理,,博弈進(jìn)行中參與人選擇某個(gè)行為的可信性特別復(fù)雜微妙,由此引發(fā)了均衡的精煉與篩選的研究,,這方面蔚為大觀,,此處就不贅述了。

【博弈論基礎(chǔ)】

有哲學(xué)趣味的人會(huì)關(guān)心,,納什均衡及其精煉作為博弈的解在何種意義上是合理的,。這也正是納什在他的博士論文附錄里所指出的:

“在所討論的博弈中,對(duì)理性地進(jìn)行博弈的可預(yù)期的行為的一個(gè)合理預(yù)測(cè)是什么,?通過運(yùn)用一些原則,,如一個(gè)合理的預(yù)測(cè)應(yīng)該是唯一的,參與人應(yīng)能充分推理和利用知識(shí),,并且對(duì)于每一個(gè)參與人,,關(guān)于其他參與人行動(dòng)的知識(shí)將不會(huì)導(dǎo)致他的行動(dòng)偏離這個(gè)合理的預(yù)期。這樣我們就得到上面我們定義的解的概念,。在這種解釋下,,我們需要假定參與人了解整個(gè)博弈的結(jié)構(gòu),從而能各自推導(dǎo)出這個(gè)預(yù)期,。這是一個(gè)理性和理想化要求很強(qiáng)的解釋,。”

故此,,納什又提出“大眾行為”(mass action)的解釋,。“在經(jīng)濟(jì)或國際政治的一些場(chǎng)合,,利益集團(tuán)不自覺地被卷入到一個(gè)非合作的博弈之中,,這種不自覺使得這個(gè)場(chǎng)合變成了一個(gè)非合作博弈。在這種解釋下,假定參與人對(duì)整個(gè)博弈的結(jié)構(gòu)有完全的知識(shí)或者有能力進(jìn)行復(fù)雜的推理不是必需的,。但是我們假定參與人能對(duì)他們的各種純策略的相對(duì)益處積累經(jīng)驗(yàn)性的信息,。我們假定存在一定的參與人群并且這些參與人的“中間分子”運(yùn)用純策略有一個(gè)穩(wěn)定的平均頻率”。

納什的洞察預(yù)示著20世紀(jì)后期關(guān)于博弈論基礎(chǔ)的研究,,即賓莫爾所強(qiáng)調(diào)的,,演繹(eductive)的與進(jìn)化(evolutive)的兩種均衡化過程。知識(shí)論與進(jìn)化論關(guān)于博弈論解概念的解釋與論證是互補(bǔ)的,。前者對(duì)應(yīng)著納什均衡在規(guī)范意義上是任何一種理性決策理論的合理內(nèi)核,;后者對(duì)應(yīng)著納什均衡在實(shí)證意義上,只能看作是對(duì)一種在進(jìn)化過程中穩(wěn)定下來的行為模式的近似刻畫,。

知識(shí)論基礎(chǔ)的要求,,如博弈結(jié)構(gòu)、解理論是博弈者之間的共同知識(shí)(每個(gè)人都知道,,每個(gè)人都知道每個(gè)人都知道,,如此以至無窮),不受限制的計(jì)算能力等,,是如此之強(qiáng)以致我們很難認(rèn)為它是現(xiàn)實(shí)的,。但是,如果我們把所有行動(dòng)看作是兩種行動(dòng)的疊加,,即均衡行為與趨向均衡的行為,,那么很強(qiáng)的理性和信息結(jié)構(gòu)指引下的均衡行為模式可以通過在模型中滿足種種穩(wěn)健性(robustness)和穩(wěn)定性(stability)的要求以弱理性下的非均衡行為來近似地逼近。

正如韋布爾所指出,,如果我們能夠表明博弈者“好像是”(as if)具有很好的理性和知識(shí)一樣行為的,,那么這就為研究者采取這樣一種描述世界的方式提供了合理性辯護(hù)。進(jìn)化博弈理論(包括學(xué)習(xí)理論),,就是要在更弱也更合理的假設(shè)上探討博弈者的長期行為,,以便達(dá)到與知識(shí)論殊途同歸,甚而給出更豐富的結(jié)論,。也就是說,,我們要探討的是,從長期(long-run)或大范圍來看,,博弈者通過學(xué)習(xí)和進(jìn)化,,他們的行為模式,在統(tǒng)計(jì)或極限意義上是什么,,以此為各種解概念下的理性行為提供合理化論證,。

特別地,針對(duì)納什均衡及其各種精煉,,有眾多結(jié)果刻畫了在什么條件下,,均衡解可以看作是進(jìn)化學(xué)習(xí)的收斂或統(tǒng)計(jì)意義上的近似,,即佩頓·楊所謂的“高理性的解概念能夠從低理性的環(huán)境中涌現(xiàn),如果我們賦予這個(gè)過程足夠的時(shí)間進(jìn)化,。

換句話說,,社會(huì)反饋機(jī)制可以取代在個(gè)體方面的知識(shí)和推理能力的高水平”。并且,,通過進(jìn)化博弈及其應(yīng)用社會(huì)生物學(xué),,我們發(fā)現(xiàn)博弈論和納什均衡的思想與方法可以有更廣泛的應(yīng)用天地。

【納什談判解與納什規(guī)劃】

現(xiàn)在,,我們轉(zhuǎn)向納什的另一項(xiàng)貢獻(xiàn)——談判或討價(jià)還價(jià)理論,。在納什的基本定理之前,他1949年(第二年發(fā)表)已經(jīng)有了一項(xiàng)了不起的經(jīng)濟(jì)學(xué)成果,。作為讀大學(xué)時(shí)選修的一門國際貿(mào)易課程的產(chǎn)物,他討論了交易中分配合作利益的討價(jià)還價(jià)問題,,并給出了有關(guān)的納什談判解的公理刻畫,。

如果二人進(jìn)行一個(gè)談判,有一組備選方案,,也有一個(gè)協(xié)議未成點(diǎn)或現(xiàn)狀是大家的退路,。達(dá)成的分配方案應(yīng)該具有這樣幾個(gè)好的性質(zhì)(我們這里的表述本質(zhì)上與納什當(dāng)年沒有差異):談判是有效率的,即不存在另一個(gè)備選方案帕雷托優(yōu)超于達(dá)成共識(shí)的,;談判是非強(qiáng)迫性的,,每個(gè)人都不差于協(xié)議未成點(diǎn);不相關(guān)方案的獨(dú)立性,,如果某方案是一個(gè)談判問題的解,,現(xiàn)在縮小方案范圍但它仍在其中,則它依然是新談判問題的解,;對(duì)稱性,,如果有傾向于甲的方案就有同樣對(duì)乙有利的方案,并且二人的退路相同,,那么結(jié)果應(yīng)該是二人所得相同,。加上其他一些數(shù)學(xué)上的適當(dāng)條件,納什證明,,合理的解應(yīng)該最大化二人的凈支付的乘積,。

三年后的文章中,納什還提出了現(xiàn)在所謂的納什規(guī)劃,,以整合非合作博弈與合作博弈,。如奧斯本與魯賓斯坦所指出,“結(jié)盟模型區(qū)別于非合作模型本質(zhì)上是因?yàn)?,它把重點(diǎn)放在博弈者團(tuán)體能實(shí)現(xiàn)什么而不是單個(gè)博弈者能做什么上,,并且它不考慮博弈者團(tuán)體內(nèi)部是如何作用的,。如果我們希望在一個(gè)非合作博弈中模擬結(jié)盟形成的可能性,那么我們必須敘述結(jié)盟是如何形成的以及他們的成員是如何選擇加入的,。一個(gè)結(jié)盟博弈沒有這些細(xì)節(jié),,這樣一個(gè)博弈的結(jié)果也不依賴于它們”。

這樣,,囚徒困境博弈所謂的困境在合作博弈中就不可能出現(xiàn),。但合作博弈卻不存在象非合作博弈中的納什均衡及其精煉等具有統(tǒng)一性的解理論。納什提出,,合作博弈的解,,可以歸結(jié)為談判解,而談判問題又可以轉(zhuǎn)換成一個(gè)動(dòng)態(tài)的非合作博弈,,這樣就可以用非合作博弈的解概念來重新闡釋合作博弈的各種解概念,。

沿著納什規(guī)劃的后續(xù)研究就包括魯賓斯坦的重要工作,他表明納什談判解可以由一個(gè)無限期動(dòng)態(tài)討價(jià)還價(jià)博弈的子博弈完美均衡來得到,。在這個(gè)意義上,,非合作博弈是比合作博弈更基本的。當(dāng)然,,現(xiàn)在大部分學(xué)者會(huì)公允地認(rèn)為合作博弈與非合作博弈是一枚硬幣的不可分割的兩面,。

也許冥冥中注定,賓默爾1992年的教科書《游戲與博弈》中提到,,納什名字的拼寫NASH代表了博弈論的英雄榜,。其中最杰出的貢獻(xiàn)者有:N當(dāng)然指博弈論的創(chuàng)始人馮諾依曼(von Neumann)和納什;A是奧曼(Aumann),;S代表了沙普利(Shapley),、塞爾頓(Selten) 和謝林(Schelling)(焦點(diǎn)效應(yīng)的提出者);H則是豪爾紹尼(Harsanyi),。

如果說,,由于偶然,納什的名字被用于構(gòu)成博弈論圣殿建造者的譜系(實(shí)際上杰出的博弈論學(xué)者的名單非常長),,那么我們可以毫無疑問地說,,納什均衡是非合作博弈論解概念大廈的基石,迄今為止,,幾乎所有因博弈論獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的理論貢獻(xiàn)都與納什的工作有一定的關(guān)聯(lián),。

這其中,豪爾紹尼和納什與賽爾頓1994年一起獲獎(jiǎng),,2005年奧曼和謝林,,2007年赫維茨、馬斯金和邁爾森,,2012年沙普利和羅斯,。1996年米爾利斯和威克瑞,,2001年阿克洛夫、斯賓塞和斯蒂格里茨,,2009年奧斯特羅姆,,2014年梯若爾,他們的獲獎(jiǎng)工作都運(yùn)用了博弈論,。實(shí)際上2002年的行為與實(shí)驗(yàn)經(jīng)濟(jì)學(xué),,2010和2011年的宏觀經(jīng)濟(jì)理論,2013年的證券理論,,也都或多或少地與博弈論有關(guān),。

【統(tǒng)一的社會(huì)科學(xué)】

協(xié)助納什發(fā)表那個(gè)運(yùn)用了角谷靜夫不動(dòng)點(diǎn)定理的簡單證明版本(1950年于《美國國家科學(xué)院院刊》)的蓋爾,曾經(jīng)贊嘆納什的結(jié)果的優(yōu)美和普遍性(elegance and generality),。所有偉大的智力成果,,都具有這兩個(gè)特征。

愛因斯坦曾經(jīng)說過,,如果一個(gè)理論不美,,它就不會(huì)是真的。從數(shù)學(xué)與自然科學(xué),,從牛頓、達(dá)爾文,、愛因斯坦,、哥德爾和無數(shù)先賢的經(jīng)典作品中,我們都能感受到這種簡單,、純凈而深刻的美感,。而普遍性,或者說普適性和統(tǒng)一性,,是好的理論最重要的品質(zhì),。

可以說,作為一個(gè)體現(xiàn)了形式簡潔性與內(nèi)容豐富性的折中的解概念,,納什均衡是整個(gè)博弈論的核心,。因機(jī)制設(shè)計(jì)理論獲獎(jiǎng)的邁爾森將納什均衡比之為生物學(xué)中的DNA雙螺旋結(jié)構(gòu)。如1998年諾獎(jiǎng)得主森所言,,博弈論和社會(huì)選擇理論是二次世界大戰(zhàn)以后社會(huì)科學(xué)最重要的成果(二者的結(jié)合產(chǎn)生了機(jī)制設(shè)計(jì)理論),。納什均衡和帕雷托優(yōu)超,作為博弈論和社會(huì)選擇理論中兩個(gè)最重要的概念,,則構(gòu)成整個(gè)社會(huì)科學(xué)大廈的拱柱,。

我相信,只要人類社會(huì)中的沖突和合作現(xiàn)象繼續(xù)存在,,社會(huì)科學(xué)繼續(xù)存在,,這兩個(gè)概念及其思想就是不朽的,。

按照邁爾森的說法,今天我們可以更寬泛地把經(jīng)濟(jì)學(xué)定義為“對(duì)所有社會(huì)制度中的激勵(lì)(incentive)的分析”,,從而“社會(huì)科學(xué)的功能性目標(biāo)并非僅僅在抽象意義上預(yù)見人類行為,,而是分析社會(huì)制度和評(píng)價(jià)關(guān)于制度革新的建議”。那么,,一個(gè)制度目標(biāo)要能夠得以實(shí)現(xiàn),,必須使其所對(duì)應(yīng)的行動(dòng)成為社會(huì)博弈的納什均衡。

由于納什“表明任何其他博弈理論都可以被化歸到均衡分析”,,他“把社會(huì)科學(xué)帶入到一個(gè)新世界,,那里可以發(fā)現(xiàn)一個(gè)研究所有沖突與合作局面的統(tǒng)一分析框架”。

附納什的四篇博弈論杰作:
John F. Nash: Equilibrium points in n-person games, Proceedings of the National Academic of Science 36, 48-49, 1950.
John F. Nash: The Bargaining Problem, Econometrica vol.18,155-162,,1950.
John F. Nash: Non-cooperative games, Annals of Mathematics 54(2), 286-295, September 1951. Also in: Essays on game theory, E. Elgar, 1996, with Appendix: Motivation and Interpretation, from doctoral thesis, Princeton University.
John F. Nash (1953): Two-person cooperative games. Econometrica vol. 21, 128-140.



作者:丁利
中山大學(xué)副教授,,研究方向:博弈論與公共選擇,法經(jīng)濟(jì)學(xué),,法理學(xué),,西方政治法律思想史。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多