納什與博弈論的發(fā)展 2015年5月23日,,美國(guó)數(shù)學(xué)家,、經(jīng)濟(jì)學(xué)家約翰·納什因遭遇車禍而身亡,終年86歲,。 約翰·納什的一生是跌宕起伏的一生:21歲時(shí),,一份只有27頁的博士論文令他名聲大噪;23歲時(shí),,擔(dān)任麻省理工學(xué)院的講師,;30歲時(shí),精神失常,;66歲時(shí),,獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。 “這人是個(gè)數(shù)學(xué)天才,?!奔{什的碩士導(dǎo)師為他讀博士寫的推薦信,只有一句話,。盡管納什在數(shù)理科學(xué)等各領(lǐng)域都取得了巨大成就,,但他最為人熟知的還是他對(duì)博弈論發(fā)展做出的貢獻(xiàn)。2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅杰·邁爾森是這樣評(píng)價(jià)約翰·納什對(duì)經(jīng)濟(jì)學(xué)領(lǐng)域所做出的杰出貢獻(xiàn)的:“他的理論對(duì)經(jīng)濟(jì)學(xué)和社會(huì)科學(xué)產(chǎn)生了根本的普遍性影響,,堪比DNA雙螺旋結(jié)構(gòu)的發(fā)現(xiàn)對(duì)生物科學(xué)領(lǐng)域產(chǎn)生的影響,。” 確實(shí),,博弈論對(duì)經(jīng)濟(jì)學(xué)的影響力不言而喻,,最近的10個(gè)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主中有5個(gè)就是博弈論理論學(xué)家。但博弈論的價(jià)值遠(yuǎn)不止于此,,如今,,隨著科學(xué)家們利用博弈論思想在進(jìn)化生物學(xué)和動(dòng)物社會(huì)行為領(lǐng)域取得了重大突破,博弈論已然成為了生命科學(xué)的基本原理,。 所謂博弈論,,一言以蔽之,就是研究理性決策者之間沖突或合作模式的相關(guān)問題,。博弈論可以用來解釋世間萬事,,從蟻群的功能機(jī)制到人類的愛情選擇、消費(fèi)選擇,,乃至國(guó)家關(guān)系的變化等等。 博弈論的研究在納什取得重大突破之前就已經(jīng)存在,,20世紀(jì)20年代到40年代之間,,美國(guó)著名數(shù)學(xué)家馮·諾依曼就做過博弈論方面的研究。不過,,直到納什對(duì)博弈論的研究取得重大突破,,博弈論這個(gè)名稱才開始為大家所熟知,。 1950年,納什在讀博士期間開始研究博弈論,。當(dāng)時(shí)博弈論仍然處于起步階段,,在普林斯頓高等研究所的美國(guó)著名數(shù)學(xué)家馮·諾依曼是當(dāng)時(shí)該領(lǐng)域的帶頭人,他對(duì)零和博弈作出了非常深入的研究,。所謂零和博弈,,即是所有對(duì)局者的收益綜合為零,一方獲益必然意味著一方損失,。 然而,,現(xiàn)實(shí)生活中的博弈沒有這么簡(jiǎn)單,雙贏和兩敗俱傷的情況常有發(fā)生,。就以當(dāng)時(shí)美蘇冷戰(zhàn)為例,,如果把對(duì)方的損失看作自己的收益的話,那么雙方的最優(yōu)策略就是,,先發(fā)制人給予對(duì)方最大的打擊,。但是對(duì)于美蘇這兩個(gè)旗鼓相當(dāng)?shù)膶?duì)手來說,對(duì)方也會(huì)激烈反擊,,這樣做的最大可能卻是兩敗俱傷,。由于有這種局限性,盡管對(duì)零和博弈的研究非常深入,,但在應(yīng)用上價(jià)值不算太大,,因?yàn)檎l都不想費(fèi)了牛大的力氣卻毫無收獲。 因此,,當(dāng)納什在1950年發(fā)表對(duì)非合作博弈的研究時(shí),,博弈學(xué)界眼前為之一亮。他換了一個(gè)角度來思考問題:不是考慮自己的最佳收益,,而是考慮雙方在什么情況下達(dá)到均衡,。他認(rèn)為,對(duì)于任何一個(gè)博弈來說,,總是存在一個(gè)“均衡點(diǎn)”,,在均衡點(diǎn)處,當(dāng)對(duì)方不改變策略時(shí),,他此時(shí)的策略是最好的,。如果更改自己的策略,反而不會(huì)帶來任何好處,。這樣的均衡點(diǎn)后來被稱為“納什均衡”,,在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。比如對(duì)美蘇博弈來說,,冷戰(zhàn),、保持強(qiáng)大的威懾力、但誰也不先動(dòng)手,,就是一個(gè)雙方都不愿意改變的“均衡點(diǎn)”,。 我們可以用個(gè)常見的現(xiàn)象來解釋下,例如價(jià)格戰(zhàn),。生產(chǎn)同一樣產(chǎn)品的若干廠家會(huì)形成一個(gè)相對(duì)穩(wěn)定的價(jià)格,,這就是“均衡點(diǎn)”。在這個(gè)“均衡點(diǎn)”,,各家所賣的產(chǎn)品價(jià)格保持基本一致,。若其中一方打破默契,開始大幅降價(jià),,以求薄利多銷,,獲取更大利潤(rùn),那么其他家便會(huì)很快跟進(jìn),,互相壓價(jià),。剛開始降價(jià)的一方短期內(nèi)可能會(huì)增加銷量和利潤(rùn),但最終的結(jié)果是大家的利潤(rùn)都降低了,。 由于納什均衡的應(yīng)用范圍遠(yuǎn)比零和博弈廣泛,,所以納什對(duì)博弈論的發(fā)展具有更重要的意義。 納什均衡: 背叛為何優(yōu)于合作,? 我們生活在一個(gè)博弈的世界,,“納什均衡”在這個(gè)世界中應(yīng)用極為廣泛,它已經(jīng)深刻地影響了一般人的生活,,絕不僅限于數(shù)學(xué)的范疇,。下面將給大家舉幾個(gè)經(jīng)典的例子,以便大家更深刻地理解約翰·納什這位奇才留給我們的精神遺產(chǎn),。 一說到博弈論,,幾乎每個(gè)人都會(huì)想到“囚徒困境”。這是最簡(jiǎn)單的一個(gè)博弈模型,,說的是警方逮捕了兩名嫌疑犯,,但沒有足夠證據(jù)指控二人有罪。于是警方分開嫌疑犯,,讓他們相互不能溝通,,并分別向兩個(gè)人提供以下相同的選擇:若一人認(rèn)罪并檢舉對(duì)方(“背叛”對(duì)方),而對(duì)方保持沉默,,此人將即時(shí)獲釋,,沉默者將坐牢3年,;若二人都保持沉默(互相“合作”),則因證據(jù)不足,,二人都坐牢1年;若二人都互相檢舉(互相“背叛”),,則二人都坐牢2年,。 在這個(gè)模型里,對(duì)兩個(gè)人來說,,合作收益最大,;彼此背叛收益最小。但對(duì)一個(gè)人來說,,他有兩種選擇,、四種結(jié)果:選擇沉默,結(jié)果是1年(對(duì)方也沉默)或3年(對(duì)方檢舉),,如果選擇檢舉,,則結(jié)果是獲釋(對(duì)方沉默)或2年(對(duì)方也檢舉)。這樣平衡下來,,檢舉是最好的選擇,。并且一方檢舉,一方沉默,,檢舉一方收益更大,。 由此看來,在“囚徒困境”中,,雙方合作收益最大(二人都坐牢1年),,但在實(shí)際情況中,每個(gè)人都首先考慮自己的收益,,所以雙方都采取了彼此背叛的策略,,結(jié)果卻導(dǎo)致兩人都坐牢2年。 囚徒困境被視為人類合作失敗的一種體現(xiàn),,它深刻揭示了個(gè)體理性與集體理性之間的矛盾和沖突:個(gè)體按照自身利益最大化的原則采取對(duì)自己最有利的占優(yōu)戰(zhàn)略,,得到的卻不一定是最優(yōu)的結(jié)果,相反可能導(dǎo)致集體的非理性,。 近年來在高考招生中,,北大、清華為了在各省爭(zhēng)搶狀元,,采取各種手段明爭(zhēng)暗斗,,甚至不惜撕破臉皮在微博上吵架,可謂斯文掃地,。作為中國(guó)最頂尖的兩所大學(xué),,難道就不知道這樣搶狀元吃相太難看嗎,?非不為也,實(shí)不能也,。 北大清華的狀元之爭(zhēng)是一個(gè)典型的囚徒困境,。對(duì)于北大來說,無論清華搶不搶狀元,,搶狀元都是北大的最好選擇,;對(duì)于清華來說也是一樣。兩所大學(xué)都搶狀元就構(gòu)成了北大清華招生博弈的納什均衡,。納什均衡最深刻的悲劇性在于,,北大和清華都意識(shí)到搶狀元是毫無意義的,但搶狀元卻是他們必然的選擇,。除非引入第三方力量改變博弈結(jié)構(gòu),,否則囚徒困境就不可能被打破。 破解之道就是改變高考招生的制度設(shè)計(jì),,改變以高考分?jǐn)?shù)為唯一依據(jù)的招生設(shè)計(jì),。美國(guó)也有高考(SAT和ACT),但從來沒聽說美國(guó)有什么高考狀元,,也沒聽說美國(guó)有什么大學(xué)為爭(zhēng)搶尖子生而鬧得不可開交,。原因就在于,美國(guó)大學(xué)申請(qǐng)不僅要看高考成績(jī),,還要看平時(shí)成績(jī)和社會(huì)活動(dòng),,每個(gè)學(xué)校還會(huì)有不同的錄取標(biāo)準(zhǔn)。在這樣的招錄制度下,,沒有哪個(gè)高校有興趣搶什么狀元,。 用制度引導(dǎo)均衡 制度如何能夠改變博弈中的納什均衡?我們來看看另一個(gè)比較著名的博弈案例:智豬博弈,。 豬圈里有兩頭豬,,一頭大豬,一頭小豬,。豬圈的一邊有個(gè)踏板,,每踩一下踏板,在遠(yuǎn)離踏板的另一邊食槽就會(huì)落下少量的食物,。由于踏板離食槽比較遠(yuǎn),,當(dāng)小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物,;若是大豬踩動(dòng)了踏板,,則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽,爭(zhēng)吃到另一半殘羹,。 那么,,兩只豬各會(huì)采取什么策略,?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊,;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間,。因?yàn)樾∝i踩踏板將一無所獲,不踩踏板反而能吃上食物,,對(duì)小豬而言,,無論大豬是否踩踏板,不踩踏板總是好的選擇,。反觀大豬,明知小豬是不會(huì)去踩動(dòng)踏板的,,但如果自己也不去踩踏板的話,,就會(huì)餓死,所以只好親力親為了,。小豬“搭便車”成了這個(gè)游戲的納什均衡點(diǎn),。 “搭便車”現(xiàn)象在人類社會(huì)中屢見不鮮。小的方面,,在集體野炊時(shí),,有人不動(dòng)手積極勞動(dòng),等著別人做好飯就來吃,;在公司里,,有些人不創(chuàng)造效益但卻分享成果。大的方面,,現(xiàn)代社會(huì)的高福利政策也是一種民眾的搭便車行為,,高收入者支付的高額稅收,對(duì)同樣享用高福利(醫(yī)療,、教育)的低稅收貢獻(xiàn)者來說,,是被后者“搭了順風(fēng)車”;在商品市場(chǎng)中,,很多商人等著成功的創(chuàng)新商品出現(xiàn),,然后大舉模仿,乃至抄襲,,就是“搭便車”行為,。 “搭便車”自然是個(gè)很壞的納什均衡點(diǎn),那么怎樣才能改變“搭便車”現(xiàn)象呢,?在“智豬博弈”中,,要想改變“小豬躺著大豬跑”的現(xiàn)象,就必須改變給豬喂食的方案,。最好的方案是將食槽移到踏板附近,,誰踩踏板誰就優(yōu)先得到食物,。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,,而多勞者多得。政策一變,,“搭便車”現(xiàn)象就自然消失了,。也就是說,改變條件,,就會(huì)形成新的納什均衡點(diǎn),。 同樣,在人類社會(huì)中,,要想杜絕“搭便車”現(xiàn)象,,也需要進(jìn)行制度設(shè)計(jì)。比如,,在國(guó)有企業(yè)的收入分配比較平均,,一些獎(jiǎng)勵(lì)也是人人有份,這就使人容易產(chǎn)生“搭便車”心理,,干活的人少,,混日子的人多。最好的激勵(lì)機(jī)制就是,,獎(jiǎng)勵(lì)并非人人有份,,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對(duì)公司而言),,又消除了“搭便車”現(xiàn)象,,能實(shí)現(xiàn)有效的激勵(lì)。 納什均衡還能夠用于解釋很多經(jīng)濟(jì)現(xiàn)象,,比如“公地悲劇”,。1968年,美國(guó)學(xué)者哈定在《科學(xué)》雜志上發(fā)表了一篇題為《公地的悲劇》的文章,。英國(guó)曾經(jīng)有這樣一種土地制度——封建主在自己的領(lǐng)地中劃出一片尚未耕種的土地作為牧場(chǎng),,無償向牧民開放(稱為“公地”)。這本來是一件造福于民的事,,但由于是無償放牧,,每個(gè)牧民都養(yǎng)盡可能多的牛羊。隨著牛羊數(shù)量無節(jié)制地增加,,公地牧場(chǎng)最終因“超負(fù)荷”而成為不毛之地,,牧民的牛羊最終全部餓死。 這樣的“公地悲劇”在現(xiàn)實(shí)社會(huì)中很常見,,環(huán)境污染,、全球暖化都是公地悲劇的體現(xiàn),。假如市場(chǎng)經(jīng)濟(jì)中存在著污染,政府又沒有管制,,企業(yè)為了追求利潤(rùn)的最大化,,寧愿以犧牲環(huán)境為代價(jià)也絕不會(huì)主動(dòng)增加環(huán)保設(shè)備投資,所有企業(yè)都會(huì)從利己的目的出發(fā),,采取不顧環(huán)境的策略 ,,從而進(jìn)入“納什均衡”狀態(tài)。如果一個(gè)企業(yè)從利他的目的出發(fā),,投資治理污染 ,,而其他企業(yè)仍然不顧環(huán)境污染,那么這個(gè)企業(yè)的生產(chǎn)成本就會(huì)增加 ,,價(jià)格就要提高,,它的產(chǎn)品就沒有競(jìng)爭(zhēng)力 ,甚至企業(yè)還要破產(chǎn),。 因此,在公共領(lǐng)域,,如果人人都可以無償使用公共資源,,那么在這個(gè)博弈中,無論在哪一個(gè)納什均衡點(diǎn)上,,公共資源都會(huì)被過度消耗,,每個(gè)人的收益最終會(huì)抵不過所付出的代價(jià)。解決這個(gè)悲劇的出路也許就是公共資源的產(chǎn)權(quán)化,,將公共資源出售或承包給私人管理,。 槍手博弈與三國(guó)演義 當(dāng)博弈者只有雙方時(shí),其均衡點(diǎn)很容易尋找,。但是生活中常見的博弈是三方還有更多方來參與,,在這種情況下,我們又怎樣尋找均衡點(diǎn),?我們來看一個(gè)槍手博弈的故事: 甲,、乙、丙三個(gè)槍手準(zhǔn)備決斗,。甲槍法最好,,十發(fā)八中;乙槍法次之,,十發(fā)六中,;丙槍法最差,十發(fā)四中,。 先提第一個(gè)問題:如果三人同時(shí)開槍,,并且每人只發(fā)一槍,;第一輪槍戰(zhàn)后,誰活下來的機(jī)會(huì)大一些,?一般人認(rèn)為甲的槍法好,,活下來的可能性大一些。但合乎邏輯的結(jié)論是,,槍法最糟糕的丙活下來的幾率最大,。 我們來分析一下各個(gè)槍手的策略。槍手甲一定要對(duì)槍手乙先開槍,,因?yàn)橐覍?duì)甲的威脅要比丙對(duì)甲的威脅更大,,甲應(yīng)該首先干掉乙,這是甲的最佳策略,;同樣的道理,,槍手乙的最佳策略是第一槍瞄準(zhǔn)甲;槍手丙的最佳策略也是先對(duì)甲開槍,。 盡管第一輪結(jié)束后,,丙活下來的可能性最大,但是第二輪開始,,丙的存活的幾率卻會(huì)比甲或乙為低,。因?yàn)樵诘谝惠啒寫?zhàn)后,不論甲或乙,,他們的命中率都比丙的命中率為高,。除非第一輪中甲乙皆死。 我們現(xiàn)在改變游戲規(guī)則,,假定甲,、乙、丙不是同時(shí)開槍,,而是他們輪流開一槍,。在這個(gè)例子中,我們發(fā)現(xiàn)丙的機(jī)會(huì)好于他的實(shí)力,。 先假定開槍的順序是甲,、乙、丙,,甲一槍將乙干掉后(80%的幾率),,就輪到丙開槍,丙有40%的幾率一槍將甲干掉,。 假設(shè)開槍的順序是乙,、丙、甲,乙先開槍,,乙還是會(huì)瞄準(zhǔn)槍法最好的甲開槍,;不管乙是否一槍干掉了甲,下一輪仍然是輪到丙開槍,。 如果開槍的順序是丙,、甲、乙,,是丙先開槍,,情況又如何呢? 丙可以向甲先開槍,,即使丙打不中甲,,甲的最佳策略仍然是向乙開槍。但是,,如果丙打中了甲,,下一輪可就是乙開槍打丙了。因此,,丙的最佳策略是胡亂開一槍,,只要丙不打中甲或者乙,在下一輪射擊中,,甲和乙仍然會(huì)互相火拼,,他就處于有利的形勢(shì)。 我們通過這個(gè)例子,,可以理解人們?cè)诓┺闹心芊瘾@勝,不單純?nèi)Q于他們的實(shí)力,,更重要的是取決于博弈方實(shí)力對(duì)比所形成的關(guān)系,。在上面的例子中,乙和丙實(shí)際上是一種聯(lián)盟關(guān)系,,先把甲干掉,,他們的生存幾率都上升了。我們現(xiàn)在來判斷一下,,乙和丙之中,,誰更有可能背叛,誰更可能忠誠(chéng),?任何一個(gè)聯(lián)盟的成員都會(huì)時(shí)刻權(quán)衡利弊,,一旦背叛的好處大于忠誠(chéng)的好處,聯(lián)盟就會(huì)破裂,。在乙和丙的聯(lián)盟中,,乙是最忠誠(chéng)的。這不是因?yàn)橐冶旧砭哂懈又艺\(chéng)的品質(zhì),而是利益關(guān)系使然,。只要甲不死,,乙的槍口就一定會(huì)瞄準(zhǔn)甲。但丙就不是這樣了,,丙不瞄準(zhǔn)甲而胡亂開一槍顯然違背了聯(lián)盟關(guān)系,,丙這樣做的結(jié)果,將使乙處于更危險(xiǎn)的境地,。 這個(gè)槍手博弈的模型顯示了多方參與下,,納什均衡的不斷變化。而且這個(gè)模型正好與我們歷史上的三國(guó)演義有一定相似之處,。公元208年,,赤壁之戰(zhàn)前,曹操大軍首先橫掃弱小的劉備,,劉備那時(shí)對(duì)曹操根本沒有還手之力,,但曹操也根本沒有把劉備放在眼里,而是把目光投向了在江東頗具實(shí)力的孫權(quán)政權(quán),。孫權(quán)為了自保,,聯(lián)絡(luò)了毫無實(shí)力但在荊州一帶很有人望的劉備,與劉備結(jié)成聯(lián)盟,,共同抗曹,。結(jié)果,借著赤壁之戰(zhàn)的勝利,,原本等著滅亡的劉備,,一躍而成為三足之一,這就是最差的反而活得更好的典型例證,。 赤壁之戰(zhàn)后,,北方的曹操與南方的孫權(quán)、劉備達(dá)成了短暫的平衡,,誰也沒有能力吃掉誰,。但孫權(quán)和劉備因利益沖突卻開戰(zhàn)起來,夷陵一戰(zhàn)后,,劉備元?dú)獯髠?,蜀漢實(shí)力從此一蹶不振。劉備與孫權(quán)開戰(zhàn),,完全打破了納什均衡,,消弱了自己的實(shí)力,這也是劉備不懂博弈論,、意氣用事的結(jié)果,。在這場(chǎng)戰(zhàn)爭(zhēng)中,作為實(shí)力第二的孫權(quán),原本應(yīng)該對(duì)孫劉聯(lián)盟最忠心,,但為了與劉備打仗,,卻去投靠了曹操。不過,,他很快醒悟過來,,夷陵之戰(zhàn)后,立刻著手修復(fù)與劉備的關(guān)系,。 接下來,,輪到諸葛亮不懂博弈論了。作為三國(guó)中最弱的一方,,身處具有大山屏障的四川腹地,,蜀國(guó)原本應(yīng)該與“槍手博弈”中的丙一樣,輪到他開槍時(shí),,朝天開個(gè)空槍,,坐看老大老二相斗,自己韜光養(yǎng)晦,、苦練內(nèi)功,,強(qiáng)國(guó)強(qiáng)民,方為上策,??墒侵T葛亮在蜀國(guó)國(guó)力貧弱的情況下,竟然七伐中原,,消耗了大量國(guó)力,,并使強(qiáng)大的曹魏始終把矛頭對(duì)準(zhǔn)自己。因此,,蜀國(guó)在三國(guó)中第一個(gè)滅國(guó)就毫不為奇了,。 抗日戰(zhàn)爭(zhēng)時(shí)期,中國(guó)大地上可謂也是一種三國(guó)格局,。日本鬼子最為猖狂,占據(jù)了中國(guó)最肥沃的半壁河山,;國(guó)民黨政府占據(jù)著西南地區(qū),,正統(tǒng)上仍是中國(guó)政府;實(shí)力最弱的共產(chǎn)黨,,統(tǒng)治地域主要集中于貧瘠的西北一隅,。為了聯(lián)合對(duì)付日本鬼子,國(guó)民黨和共產(chǎn)黨這兩個(gè)殺紅了眼的冤家對(duì)頭結(jié)成聯(lián)盟,,相當(dāng)于槍手乙和槍手丙結(jié)盟對(duì)付甲,。不過,共產(chǎn)黨人比諸葛亮更懂博弈論,他們對(duì)付日本人主要采取游擊戰(zhàn),,而不是與日本鬼子正面硬碰硬,。因此,抗戰(zhàn)勝利后,,八路軍的實(shí)力大大增強(qiáng),,與國(guó)民黨實(shí)力的差距大大縮小,在隨后的國(guó)共對(duì)決中,,共產(chǎn)黨很快占了上風(fēng),。 處處可見的納什均衡 納什均衡這么理論化的數(shù)學(xué)問題,卻也能應(yīng)用到戀愛中,。在約翰·納什的傳記電影《美麗心靈》中就有很好的例子,,納什和他的四個(gè)男伙伴在酒吧,而對(duì)面正好有五個(gè)單身女生,,其中一個(gè)最為漂亮,。如果納什和他的四個(gè)男伙伴都去追求最為漂亮的女神,那么女神就會(huì)不知道同意誰而全部拒絕,。追求女神不行,,接下來追求剩下的四位女生,這四個(gè)女生當(dāng)然也不會(huì)同意,,因?yàn)闆]人愿意屈居第二,,當(dāng)“備胎”。這樣就會(huì)造成誰也沒有搭訕成功,。如果納什他們改變策略,,一開始誰都不去追求女神,四位男生分別去追求其她四位女生,,當(dāng)女神看到其她女生都有人追求,,而自己卻沒有,這時(shí)如果納什去追求女神,,到手的幾率就會(huì)大大增大,。在這個(gè)策略下,每個(gè)人都有可能搭訕成功,。 搭訕成功后,,假設(shè)納什真的開始了對(duì)女神的追求,那么,,其實(shí)女神也還有其他不止一個(gè)追求者,,對(duì)于女神來說,如何確定誰是真正的追求者是個(gè)難題,,因?yàn)樗龥]辦法完全掌握每個(gè)追求者的內(nèi)心世界,,這是一種“非完全信息博弈”,。這時(shí)她就需要某種信號(hào)來篩選了。在證明真愛方面,,一句“我愛你”是沒有作用的,,還需要其他行動(dòng)。這些行動(dòng)是要付出成本的,,不管是為了努力接近女孩所需要的時(shí)間成本,,還是為了討好女孩的物質(zhì)成本,證明真愛,,就要發(fā)出對(duì)你有成本的信號(hào),,以凸顯出你值得她選擇。 這樣的博弈最終會(huì)導(dǎo)致兩種均衡,。一種是,,追求者相繼退出競(jìng)爭(zhēng),不再投入成本,,而堅(jiān)持得最久,、投入成本最多的那個(gè)人最終勝出,從眾多的追求者中分離開來,,這叫做“分離均衡”,。“分離均衡”在生活中很常見,,比如,,公司招聘時(shí)無法斷定一個(gè)人的能力,就以學(xué)歷來區(qū)分人才,;而應(yīng)聘者也以工資高低來衡量公司好壞,,雙方互相衡量,最后達(dá)至“分離均衡”,。 另一種是,,到最后,兩種人也沒完全區(qū)分出來,,一些愛得不那么深的人也混在真愛中,,繼續(xù)花費(fèi)成本發(fā)送信號(hào)對(duì)誰都不再值得,姑娘索性選一個(gè)人嫁了得了,,這叫做“混同均衡”,。“混同均衡”在現(xiàn)實(shí)生活中也很常見,,比如小孩子上學(xué),,如果不是特別要去擇校的話,,他就是隨便選一個(gè)學(xué)校就上學(xué)了,,因?yàn)榱x務(wù)教育階段的學(xué)校沒什么好區(qū)分的,,這就是“混同均衡”。 非完全信息的博弈在生活中處處可見,。比如在足球比賽射點(diǎn)球時(shí),,射門的運(yùn)動(dòng)員是射左邊還是射右邊呢?沒有哪個(gè)更好,,踢球者只希望射門方向與門將撲球的方向相反,;而門將所追求的,則是相同,。這里沒有純策略均衡,,只有混合策略均衡。也就是說,,射門者最終只會(huì)以一定的概率去踢左邊,,一定的概率踢中間,一定的概率踢右邊,;而門將也會(huì)有一定的概率撲左邊,,一定概率不動(dòng),一定的概率撲右邊,。按照這種概率分布,,存在均衡。 證明博弈中存在這樣一個(gè)混合策略均衡,,就是納什的貢獻(xiàn),。還拿射點(diǎn)球?yàn)槔樱瑢?duì)于門將而言,,他不知道射門者的偏好,,只能是對(duì)這個(gè)偏好進(jìn)行一個(gè)估計(jì),如果是右撇子,,他會(huì)估計(jì)說這個(gè)球員踢向門左側(cè)的策略會(huì)大一些,。那么,根據(jù)這一估計(jì),,他會(huì)以更大的概率按照這個(gè)方向去撲球,。但是,射門的人完全有可能踢向另一個(gè)方向,。 另外一個(gè)例子,,就是出價(jià)買東西。買方喊出一個(gè)買價(jià)的時(shí)候,,是不知道賣家心目中的合適價(jià)格的,,怕喊高了;同樣的道理,,要是賣家喊價(jià),,也有可能喊低了,。但是這個(gè)喊價(jià)無論出自賣方還是買方,都存在一個(gè)概率分布,,這里有一個(gè)混合策略均衡,。 這樣的混合策略均衡甚至在宏大的政治經(jīng)濟(jì)層面也不鮮見。在政治上,,比如革命的群體協(xié)作,,你是否揭竿而起不僅取決于你相信政權(quán)有多么脆弱,還同時(shí)取決于你相信別人是否參與,。在經(jīng)濟(jì)學(xué)上,,一個(gè)很好的例子是銀行擠兌,你是否擠兌不僅取決于你對(duì)銀行有多信賴,,也取決于你相信別人是否會(huì)擠兌,。在這樣的博弈中,其均衡點(diǎn)是動(dòng)態(tài)的,?!?/p> 由于納什均衡的提出和不斷完善,博弈論開始廣泛應(yīng)用于經(jīng)濟(jì)學(xué),、管理學(xué),、社會(huì)學(xué)等學(xué)科中。不光是這些專業(yè)領(lǐng)域,,我們?cè)谏钪写驌淇?、買東西、下圍棋時(shí),,都有可能在不經(jīng)意間運(yùn)用了博弈論和納什均衡,。我們都不是科學(xué)家,但可以站在科學(xué)家的肩膀上,,利用他們的研究成果幫助我們思考,,幫助我們更好地生活。 |
|