1 一種新的邏輯:博弈邏輯
博弈論研究人類活動(dòng)中的互動(dòng)行為,在經(jīng)濟(jì)學(xué)中得到廣泛的運(yùn)用,。在博弈論中,,人類的所有活動(dòng),只要是互動(dòng)行為,,均可以看成是博弈行動(dòng),。在此基礎(chǔ)上,一種新的邏輯“博弈邏輯”(game
logic)得以興起,,它是一種特殊的行動(dòng)邏輯(action
logic),。
博弈論研究多個(gè)理性人在互動(dòng)過程中如何選擇自己的策略。理性的人是使自己的目標(biāo)或得益最大化的人,,在經(jīng)濟(jì)活動(dòng)中理性的人即是使經(jīng)濟(jì)目標(biāo)最大化的人——經(jīng)濟(jì)人,。理性人如何使得自己的“得益”最大?關(guān)鍵是“推理”,。
博弈邏輯中存在著兩種研究綱領(lǐng),。第一種研究綱領(lǐng)是結(jié)合模態(tài)邏輯系統(tǒng),建立新的博弈邏輯系統(tǒng),。在這方面,,日本筑波大學(xué)的金子守(Mamoru
Kaneko)教授是這方面的權(quán)威。近幾年,,他在國際刊物上發(fā)表了大量有關(guān)博弈邏輯方面的論文,。他不僅在模態(tài)邏輯系統(tǒng)的基礎(chǔ)上建立了多個(gè)博弈邏輯(game
logic)系統(tǒng),而且,,建立了與博弈邏輯密切相關(guān)的公共知識(shí)邏輯(common knowledge
logic)系統(tǒng),。第二種研究綱領(lǐng)是研究博弈活動(dòng)中的實(shí)際“推理問題”,,許多博弈論專家在此方面做了大量的工作。對博弈邏輯做整體的分析不是這里的任務(wù),,本文的目的是簡要論述博弈活動(dòng)中的推理問題,,屬于第二種研究綱領(lǐng)。
根據(jù)博弈論,,人們在實(shí)際的博弈活動(dòng)中涉及到兩種推理:演繹推理與歸納推理,。然而,正如傳統(tǒng)邏輯中存在著悖論(演繹悖論和歸納悖論),,在博弈邏輯中同樣存在著悖論,。
2 博弈邏輯中的演繹推理與歸納推理
博弈論有兩個(gè)假定:第一,博弈參與人是理性的,;第二,,博弈參與人的得益不僅取決于自己的行動(dòng),同時(shí)取決于其他人的行動(dòng),。
每個(gè)理性的參與人在策略選取,,使自己得益最大時(shí),要充分考慮局中其他人的策略選取,。同時(shí),,每個(gè)參與人知道其他參與人與他有同樣的想法。在博弈中,,“每個(gè)人是理性的”是公共知識(shí)(common
knowledge),,它是每個(gè)參與人進(jìn)行策略選擇或者推理的前提。
博弈參與人的推理表現(xiàn)在他對策略的選取上,。決定參與人的策略選取一方面是博弈結(jié)構(gòu),,另一方面是其他參與人的策略。博弈結(jié)構(gòu)是不同策略組合下的支付函數(shù)或者得益函數(shù),。按照博弈的次序來分,,博弈分動(dòng)態(tài)與靜態(tài)博弈;按照信息的分布來分,,博弈分為完全信息與不完全信息博弈,。在不同的博弈結(jié)構(gòu)下,參與人所用的推理不同,。
根據(jù)參與人推理前提與結(jié)論之間的關(guān)系,,在博弈中推理分為演繹推理和歸納推理。我們來分析博弈參與人是如何運(yùn)用演繹推理與歸納推理的,。
(1)靜態(tài)博弈的演繹推理
讓我們來分析典型的“囚徒博弈”的例子,。
警察抓到了兩個(gè)共同偷竊的小偷,對他們進(jìn)行單獨(dú)關(guān)押。囚徒面臨這樣的“政策”:如果一方“招認(rèn)”,,供出自己與對方以前所做違法之事,,而對方“不招認(rèn)”,“招認(rèn)”方將無罪釋放,,對方會(huì)被判重刑10年,;如果雙方都與警方合作,選擇“招認(rèn)”策略,,各被判刑5年,;而如果雙方均“不招認(rèn)”,因警察找不到其他證明他們以前違法的證據(jù),,只能對他們的小偷行為進(jìn)行懲戒,,各判刑1年。這兩個(gè)小偷如何做出選擇,?
囚徒困境的支付矩陣為: 附圖 “囚徒困境”是一個(gè)被廣泛談?wù)摵脱芯康牟┺?。在這個(gè)囚徒困境中,小偷的最終“得益”是當(dāng)場釋放還是被判刑(10年,、5年,、1年),不僅取決于該囚徒的決定,,而且取決于另外的小偷的決定,。
在這個(gè)例子中,,每個(gè)小偷都作這樣的推理: 如果對方“招認(rèn)”,, 我“不招認(rèn)”的結(jié)果是判刑10年,“招認(rèn)”的結(jié)果是判刑5年,; “招認(rèn)”的結(jié)果好于“不招認(rèn)”的結(jié)果 此時(shí),,我應(yīng)當(dāng)選擇“招認(rèn)” 如果對方“不招認(rèn)”, 我“不招認(rèn)"的結(jié)果是判刑1年,,“招認(rèn)”的結(jié)果是當(dāng)場釋放,; 當(dāng)場釋放比判刑1年要好 此時(shí),我應(yīng)當(dāng)選擇“招認(rèn)” 因此,,無論對方采取“招認(rèn)”還是“不招認(rèn)”,,我最好的策略是“招認(rèn)”。 無論是甲,,還是乙,,他們均推理得出最好的策略是“招認(rèn)”。雙方均招認(rèn)是“納什均衡”——這是一個(gè)穩(wěn)定的結(jié)果,。
在囚徒博弈中存在惟一的納什均衡(注:納什均衡,,簡單地說就是,一策略組合中,所有的參與者面臨這樣的一種情況:當(dāng)其他人不改變策略時(shí),,他此時(shí)的策略是最好的,;也就是說,此時(shí)如果他改變策略,,他的支付將會(huì)降低,。在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng),。)點(diǎn),,即兩個(gè)囚犯均選擇“招認(rèn)”策略。一旦人們處于囚徒困境,,“囚徒困境有惟一的納什均衡點(diǎn)”構(gòu)成參與人的“公共知識(shí)”,,雙方均毫不猶豫地選擇“招認(rèn)”。
這是靜態(tài)博弈的例子,。在這個(gè)推理過程中,,雙方的推理均是演繹的。
(2)動(dòng)態(tài)博弈中的演繹推理
動(dòng)態(tài)博弈過程如同靜態(tài)博弈,,也是一個(gè)推理過程,。我們來看一下動(dòng)態(tài)博弈中人們是如何進(jìn)行演繹推理的。先看一個(gè)例子,。
有兩個(gè)企業(yè)A,、B。企業(yè)B獨(dú)占一個(gè)行業(yè)的市場,,企業(yè)A要進(jìn)入這個(gè)領(lǐng)域,,想與企業(yè)B瓜分該市場。企業(yè)B不愿意A與它一起瓜分該市場,,它發(fā)出“威脅”:“如果你進(jìn)入,,我將打擊”。當(dāng)然,,對B進(jìn)行打擊,,雙方均有損失?!@是雙方的“公共知識(shí)”,。該博弈用博弈樹表示,即為: 附圖 上圖中的數(shù)字表明:如果A“不進(jìn)入”,,A的得益為0,,B的得益為10;如果A“進(jìn)入”,,B“不打擊”的話,,A與B平分10,,各得到5,而如果“打擊”的話,,A的收益為-3,,B的收益為4。 這個(gè)博弈的結(jié)果是,,A選擇“進(jìn)入”,,B選擇“不打擊”?!鼈儤?gòu)成“子博弈精煉納什均衡”,。對于這個(gè)博弈,B的威脅“如果A進(jìn)入,,我將打擊”是“不可信的”威脅,。 在這個(gè)動(dòng)態(tài)博弈中,理性的參與人所用的推理方法被稱為“逆向歸納法”又稱“倒推法”(backward
induction),。雖然被稱為逆向歸納法,,但它是完全歸納法,即它是演繹性的,。 逆向歸納法是求解動(dòng)態(tài)博弈的方法,。它是演繹性的,因?yàn)樗耐评硎潜厝坏?。在上面的例子,,我們看到,企業(yè)A作這樣的推理: 假定我(A)進(jìn)入,,B如果“打擊”,,它的得益為4;“不打擊”的得益為5,。B是理性人,。它將選擇“不打擊”,。既然我預(yù)測到B將“不打擊”,,我在“進(jìn)入”和“不進(jìn)入”間進(jìn)行選擇時(shí),“進(jìn)入”的得益為5,,“不進(jìn)入”的得益為0,,我作為理性人,將選擇“進(jìn)入”,。 當(dāng)A選擇“進(jìn)入”策略時(shí),,B的推理是: 如果采取“打擊”,我的得益為4,;“不打擊”的得益為5,,選擇“不打擊”是理性的選擇。
(3)靜態(tài)博弈中的歸納推理
博弈中參與人運(yùn)用歸納推理,原因大體有兩個(gè):一是由于信息不完全,;二是由于博弈是競爭性的——零和博弈,。
不完全信息博弈,又稱貝葉斯博弈,,是博弈論研究的重要內(nèi)容,。不完全信息博弈是指博弈參與人的得益函數(shù)不是公共知識(shí)時(shí)的博弈。此時(shí),,雖然博弈參與人是理性的構(gòu)成公共知識(shí),。但是,總存在某個(gè)策略組合下的得益不是公共知識(shí),。這樣,,即使一個(gè)博弈存在惟一的納什均衡,由于這個(gè)均衡不是公共知識(shí),,這樣的均衡不能夠在一次博弈中達(dá)到,。而所謂競爭性的博弈是指零和博弈,在一個(gè)博弈中如果只有兩個(gè)參與人,,其中一方所得等于另外一方所失,,此時(shí),雙方不可能形成一個(gè)大家均接受而不會(huì)改變的純策略對,。
在這樣的過程中,,博弈參與人如何確定自己的策略選取呢?他只能根據(jù)其他參與人“歷史”中的策略“歸納地”得出對方此時(shí)的策略,,從而決定自己的策略,。一個(gè)例子就是,《叁國演義》一書中“空城計(jì)”博弈,。
諸葛亮誤用馬謖,,致使街亭失守??酌髟谖鞒侵?,準(zhǔn)備啟程。等他安排停當(dāng),,司馬懿引大軍15萬蜂擁而來,。當(dāng)時(shí)孔明身邊別無大將,只有一班文官,,五千軍士,,已分一半先運(yùn)糧草去了,只剩二千五百軍在城中,。眾官聽到這個(gè)消息,,盡皆失色,。孔明登城望之,,果然塵土沖天,,魏兵分兩路殺來??酌鱾髁畋妼?,旌旗竟皆藏匿,諸軍各收城鋪,。打開城門,,每一門用上二十軍士,扮作百姓,,灑掃街道,。而孔明披鶴髦,戴綸巾,,引二小童,,攜琴一張,于城上敵樓前,,憑欄而坐,,焚香操琴。馬司懿來到城下,,見到諸葛亮焚香操琴,,笑容可掬。司馬懿嚇壞了,,立即叫后軍作前軍,,前軍作后軍,急速退去,。司馬懿之子司馬昭問:莫非諸葛亮無軍,,故作此態(tài),父親何故退兵,?司馬懿說:“亮平生謹(jǐn)慎,,不曾弄險(xiǎn),今大開城門,,必有埋伏,。我兵若進(jìn),,中其計(jì)也,。”孔明見魏軍退去,撫掌而笑,,眾官無不駭然,。諸葛亮說:司馬懿料吾平生謹(jǐn)慎,,不曾弄險(xiǎn),見如此模樣,,疑有伏兵,,所以退去。吾非行險(xiǎn),,蓋因不得已而用之,。我們兵只有二千五百,若棄城而去,,必為之所擒,。
我們可以用如下的博弈矩陣來表示這個(gè)博弈: 附圖 這個(gè)博弈中,“進(jìn)攻”是司馬懿的“占優(yōu)策略”,。該博弈有兩個(gè)納什均衡,,即:(司馬懿“進(jìn)攻”,諸葛亮“守城”),;(司馬懿“進(jìn)攻”,,諸葛亮“棄城”)。然而,,司馬懿不知道自己和對方在不同行動(dòng)策略下的支付,,而諸葛亮知道。他們對博弈結(jié)構(gòu)的知識(shí)是不對稱的:諸葛亮擁有比司馬懿較多的知識(shí),。當(dāng)然這種知識(shí)的不對稱完全是諸葛亮“制造出來的”,。
司馬懿是如何推理的呢?司馬懿的推理是“歸納的”,。司馬懿說:“亮平生謹(jǐn)慎,,不曾弄險(xiǎn)。今大開城門,,必有埋伏,。我兵若進(jìn),,中其計(jì)也。”在司馬懿看來,,諸葛亮一生都是謹(jǐn)慎的,,既然諸葛亮一生沒有冒險(xiǎn),此次也肯定不會(huì)冒險(xiǎn),,諸葛亮有埋伏,。司馬懿在“攻城”和“撤退”之間作出“撤退”的選擇。
在這里,,司馬懿歸納作出了一個(gè)錯(cuò)誤的策略選擇,。盡管如此,,我們不能說司馬懿是不理性的。司馬懿作出錯(cuò)誤的策略選取,,是由于不完全信息造成的,。在孔明-司馬懿的博弈中,孔明做出的空城假象,,目的就是讓司馬懿感到“攻城”有較大的失敗的可能,。如果我們用概率論的術(shù)語來說,,諸葛亮的做法是加大司馬懿對進(jìn)攻失敗的主觀概率。此時(shí),,在司馬懿看來,,“攻城”失敗的可能性較大,而“撤退”的期望效用大于“攻城”的期望效用,。即:司馬懿認(rèn)為,,“攻城”的期望效用低于“撤退”的效用。諸葛亮惟有通過這個(gè)辦法,,才能讓司馬懿退兵,。
(4)動(dòng)態(tài)博弈中的歸納推理
下面我們來分析“酒吧問題”中人們是如何運(yùn)用歸納推理的。“酒吧問題”是一個(gè)重復(fù)性的動(dòng)態(tài)博弈,。 “酒吧問題”(bar
problem)是美國人阿瑟(W.B.Arthur)提出的,。阿瑟是斯坦福大學(xué)經(jīng)濟(jì)學(xué)教授,同時(shí)是美國著名的圣塔菲研究所(Santa
Fe
lnstitute)研究人員,。他不滿意經(jīng)濟(jì)學(xué)中人們所認(rèn)為的,,經(jīng)濟(jì)主體或行動(dòng)者(agents)的行動(dòng)是建立在演繹推理基礎(chǔ)之上的觀點(diǎn)。他認(rèn)為人們的行動(dòng)是基于歸納的基礎(chǔ)之上的,。“酒吧問題”就是阿瑟為了說明他的這個(gè)觀點(diǎn)而提出的,。
在1994年《美國經(jīng)濟(jì)評(píng)論》的題為《歸納論證和有界理性》一文中阿瑟提出了“酒吧問題”博弈,后來在1999年的著名的《科學(xué)》雜志上題為《復(fù)雜性和經(jīng)濟(jì)》一文又闡述了這個(gè)博弈,。
酒吧問題是指這樣一個(gè)博弈:有一群人,,比如總共有100人,每個(gè)周末均要決定,是去附近的一個(gè)酒吧活動(dòng)還是呆在家里,。該酒吧的容量是有限的,,比如空間是有限的,,或者座位是有限的,。我們假定酒吧的容量是60人,或者說座位是60個(gè),。如果去酒吧的人數(shù)少于60,,并且他也去了,他的決定就是正確的,;或者,,如果去酒吧的人超過60人,而他沒有去——當(dāng)然這只有事后才知道,,他的決定也是正確的,。否則,其決定是錯(cuò)誤的,。
這里,,我們假定他們之間不存在信息交流。我們看到,,每個(gè)人根據(jù)對總的去酒吧人數(shù)的預(yù)測,,而決定去酒吧與否。如果他預(yù)測去酒吧的人數(shù)超過60人,,他將做出“不去酒吧”的決定,,如果其預(yù)測不超過60人,他將做出“去酒吧”的決定,。他們是如何做出預(yù)測呢,?
每個(gè)參與者或決策者面臨的信息只是以前去酒吧的人數(shù),每個(gè)參與者只能根據(jù)以前去的人數(shù)的信息“歸納”地得出一個(gè)規(guī)律,。根據(jù)這個(gè)規(guī)律,,參與人預(yù)測下次去酒吧的人數(shù),從而決定自己去還是不去,。 這是一典型的動(dòng)態(tài)博弈問題,。假定,前面幾周去酒吧的人數(shù)如下:
44,76,23,77,45,66,78,22……
不同的行動(dòng)者可根據(jù)過去的歷史“歸納”出某個(gè)規(guī)律,,從而做出預(yù)測,。例如預(yù)測:下次的人數(shù)將是前4周的平均數(shù)(53);兩點(diǎn)的周期環(huán)(78),;與前面隔一周的相同(78)……,。
通過計(jì)算機(jī)的模型實(shí)驗(yàn),阿瑟得出一個(gè)有意思的結(jié)果,。當(dāng)不同的行動(dòng)者根據(jù)過去的歷史而進(jìn)行行動(dòng)時(shí),,去酒吧的人數(shù)沒有一個(gè)可預(yù)測的固定的規(guī)律,。然而有這樣一個(gè)“規(guī)律”:經(jīng)過一段時(shí)間以后,“平均去酒吧的人數(shù)總是趨于60”,。即,,經(jīng)過一段時(shí)間,這個(gè)系統(tǒng)中的人群“去”與“不去”的人數(shù)比是60:40,。盡管每個(gè)人不會(huì)固定地屬于“去”或“不去”的人群,,但這個(gè)系統(tǒng)的這個(gè)比例是不變的。阿瑟說,,預(yù)測者自組織到一個(gè)均衡類型或生態(tài)均衡系統(tǒng),。這100人構(gòu)成的系統(tǒng)是一個(gè)混沌系統(tǒng)(混沌系統(tǒng)的行為是不可預(yù)測的)。
這就是酒吧問題,。在這個(gè)問題中,,每個(gè)參與人根據(jù)歷史數(shù)據(jù)進(jìn)行歸納并進(jìn)行預(yù)測,然而,,對于下次去酒吧的確定的人數(shù),,參與人是無法作出肯定的預(yù)測。例如,,有趣的是,,如果許多人均預(yù)測去酒吧的人數(shù)多于60,而決定不去酒吧,,此時(shí)酒吧的人數(shù)將少于60,。他們的預(yù)測則錯(cuò)了。如果許多人預(yù)測去酒吧的人數(shù)少于60,,這些人去了酒吧,,此時(shí)去酒吧的人數(shù)多過60。他們的預(yù)測也錯(cuò)了,。 附圖 因此人們要作出“正確的”預(yù)測,,他要知道其他人如何作出預(yù)測的。但是在這個(gè)問題中每個(gè)人的預(yù)測的信息來源是一樣的,,即都是過去的去酒吧的人數(shù),。每個(gè)人不知道別人如何作出預(yù)測的信息。因此,,所謂“正確”預(yù)測是沒有的,。每個(gè)人只能根據(jù)以往歷史“歸納地”作出預(yù)測,而無其他辦法,。阿瑟教授提出這個(gè)問題,,是強(qiáng)調(diào)在實(shí)際中歸納推理與行動(dòng)之間的實(shí)際關(guān)聯(lián)。
利用歸納法的另外的例子是寡頭壟斷廠商之間的博弈。如果一個(gè)行業(yè)被多個(gè)寡頭廠商所壟斷,,他們之間的競爭也是一個(gè)重復(fù)性的動(dòng)態(tài)博弈,。寡頭廠商要確定自己最優(yōu)的生產(chǎn)產(chǎn)量,但它們無法知道其他企業(yè)的產(chǎn)量,。每個(gè)企業(yè)只能根據(jù)過去其他企業(yè)的生產(chǎn)產(chǎn)量來“推測”它們將要生產(chǎn)的產(chǎn)量,,從而確定自己的最優(yōu)產(chǎn)量。這個(gè)產(chǎn)量是最優(yōu)的,?不一定,。如果是,,它們就不調(diào)整自己的產(chǎn)量,,如果不是,他們還要不斷地調(diào)整,。這同樣是一個(gè)“歸納”和“調(diào)整”的過程,。
3 演繹推理的一個(gè)悖論:逆向歸納法悖論
逆向歸綱法是演繹推理,它是求解完全且完美信息下的動(dòng)態(tài)博弈的方法,。逆向歸納法推理嚴(yán)密,。然而,將看到,,逆向歸納法面臨著致命的缺陷:悖論,。
讓我們來看一個(gè)蜈蚣博弈(centipede
game)的例子。 蜈蚣博弈是由羅森塞爾(Rosenthal)提出的,。它是指這樣一個(gè)博弈:兩個(gè)參與者A,、B輪流進(jìn)行策略選擇:可供選擇的策略有“合作”和“不合作”兩種。假定A先選,,然后是B,,接著是A,如此交替進(jìn)行,。A,、B之間的博弈次數(shù)為一有限次,比如198次,。假定這個(gè)博弈的各自的支付給定如下: 附圖 蜈蚣博弈 上圖中,,c表示“合作策略”,nc表示“不合作”,。 在這個(gè)博弈中的參與人A,、B是如何進(jìn)行策略選擇的? 這個(gè)博弈形狀像一只蜈蚣,,而被命名成蜈蚣博弈,。這個(gè)博弈奇特之處是:當(dāng)A決策時(shí),他考慮博弈的最后一步即第198步:B在“合作”和“不合作”之間作出選擇時(shí),因“合作”給B帶來i00的收益,,而“不合作”帶來101的收益,,根據(jù)理性人的假定,B會(huì)選擇“不合作”,。但是,,要經(jīng)過第197步才到第198步,在197步,,A考慮到B在第198步時(shí)會(huì)選擇“不合作”——此時(shí)A的收益是98,,小于B合作時(shí)的100——那么在第197步時(shí),他的最優(yōu)策略是“不合作”——因?yàn)?#8220;不合作”的收益99大于“合作”的收益98,。……如此推論下去,。最后的結(jié)論是:在第一步A將選擇“不合作”,此時(shí)各自的收益為1,!遠(yuǎn)遠(yuǎn)小于大家都采取“合作”策略時(shí)的收益:A:101,B:99,。
根據(jù)逆向歸納法,結(jié)果是令人悲傷的,。從邏輯推理來看,,逆向歸納法是嚴(yán)密的。但結(jié)論是違反直覺的,。直覺告訴我們,,一開始就停止的策略A、B均只能獲取1,,而采取合作性策略有可能均獲取100,,當(dāng)然A一開始采取合作性策略有可能獲得0,但1或者0與100相比實(shí)在是太小了,。直覺告我們采取“合作”策略是好的,。而從邏輯的角度看,A一開始應(yīng)選擇“不合作”的策略,。
是逆向歸納法錯(cuò)了,,還是直覺錯(cuò)了?
似乎逆向歸納法不正確,。然而,,我們會(huì)發(fā)現(xiàn),即使雙方開始能走向合作,,即雙方均采取合作策略,,但這種合作不會(huì)堅(jiān)持到最后一步。理性的人出于自身利益的考慮,,肯定在某一步采取不合作策略,。逆向歸納法肯定在某一步要起作用,。只要逆向歸納法起作用,合作便不能進(jìn)行下去,。
因此,,我們不能懷疑逆向歸納法的合理性,它的推理過程嚴(yán)密,,符合邏輯,。然而如果我們用逆向歸納法來求解蜈蚣博弈,則博弈結(jié)果是我們不能接受的,。
許多博弈論專家認(rèn)為,,蜈蚣博弈所反映的不是悖論,逆向歸納法作為求解動(dòng)態(tài)博弈的方法,,是有效的,。蜈蚣博弈的結(jié)果盡管不是我們所期望的,但它是均衡結(jié)果,。這個(gè)均衡結(jié)果反映的是多主體下個(gè)體理性的局限,。這是理性的困境,。
4 博弈行為中歸納推理的“合理性”問題
休謨告訴我們,,人們使用歸納法尋求自然現(xiàn)象之間的因果聯(lián)系的這個(gè)過程,只不過是人的心理上的習(xí)慣聯(lián)想,。我們有什么其他理由認(rèn)為,,我們所認(rèn)為的事物之間的所謂因果聯(lián)系是必然的?這就是休謨問題,。休謨質(zhì)疑的是認(rèn)識(shí)中的歸納法的合理性問題,。在博弈行為中,歸納推理同樣存在是否合理的問題,。
我們用歸納法對自然進(jìn)行認(rèn)識(shí),,并根據(jù)我們歸納的結(jié)果做出相應(yīng)的行動(dòng)。如:我們看到天空中烏云密布,,風(fēng)漸漸地大了,,我們想,天可能要下雨了,,我們要帶傘,。之所以有這樣的認(rèn)識(shí),是因?yàn)橐酝慕?jīng)驗(yàn)“告訴”我們:當(dāng)烏云增多并刮大風(fēng)時(shí),,意味著要下大雨,。即,當(dāng)我們面對自然現(xiàn)象時(shí),,我們根據(jù)過去的經(jīng)驗(yàn)來歸納并采取相應(yīng)的行動(dòng),。
在認(rèn)識(shí)論中,,我們知道,歸納推理所得出的結(jié)論是或然的,。但是在認(rèn)識(shí)中我們存在著這樣一個(gè)信念:全稱命題要么真,、要么假,并且它是超越時(shí)間和空間的,。我們用歸納法可以不斷地接近真理,。在互動(dòng)的博弈中,理性的人運(yùn)用歸納法進(jìn)行推理時(shí),,歸納法是否有效,?它的合理性在哪里?
在“酒吧問題”中,,我們憑什么說,,以前去酒吧的人數(shù)與下次去酒吧的人數(shù)之間有聯(lián)系呢?當(dāng)某人進(jìn)行預(yù)測時(shí),,只有當(dāng)他知道其他人預(yù)測的方法,,他才能根據(jù)以往的人數(shù)和其他人的預(yù)測方法來“正確地”預(yù)測下次去酒吧的人數(shù)。這樣的預(yù)測才能是“有根據(jù)的”或者說“有理由的”,。但我們除了能知道以往去酒吧的人數(shù)外,,我們無法知道其他人的預(yù)測的方法。即使我們知道了其他人的預(yù)測方法,,但當(dāng)其他人知道了我們將根據(jù)他們的預(yù)測方法來預(yù)測時(shí),,他們將改變他們的預(yù)測方法,從而使我們的預(yù)測歸于無效,。
在酒吧問題上,,我們通過歸納法無法準(zhǔn)確預(yù)測下次去酒吧的人數(shù),那么我們通過對過去的歷史能夠知道什么,?或者,,在更一般的意義上說,在博弈行動(dòng)中,,人們通過歸納法能夠?qū)W習(xí)到什么東西,?這就是歸納法的合理性問題。
我們發(fā)現(xiàn),,在博弈中歸納法的有效性體現(xiàn)在參與人對博弈均衡的認(rèn)識(shí),。即通過歸納性的學(xué)習(xí),博弈參與人對該博弈均衡獲得了認(rèn)識(shí),,對其他參與人的均衡策略也獲得了認(rèn)識(shí),。
任何一個(gè)博弈均存在均衡,這也是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者約翰·納什的貢獻(xiàn),,被稱為納什均衡存在定理,。然而,,這里的均衡有兩類:一類是純策略均衡,另一類混合策略均衡,。歸納法的作用就是對這兩種均衡的認(rèn)識(shí),。
當(dāng)一個(gè)博弈存在惟一一個(gè)純策略納什均衡點(diǎn)時(shí),并且該博弈是完全信息博弈,,參與人在一次博弈中就可達(dá)到均衡點(diǎn),。但當(dāng)博弈不是完全信息博弈時(shí),博弈參與人通過多次博弈,,“了解”其他參與人不同策略組合下的得益,,一旦策略組合達(dá)到了納什均衡,博弈方均無意改變策略,。因?yàn)榇藭r(shí),,這一點(diǎn)是博弈各方均能夠接受的點(diǎn)。在這樣的過程中,,參與人通過歸納法認(rèn)識(shí)到該策略均衡,,同時(shí)認(rèn)識(shí)到其他參與人的策略選擇。
如果不存在純策略均衡,,而只存在混合策略均衡,,博弈參與人通過歸納法同樣能夠認(rèn)識(shí)到該混合策略均衡,同樣能夠認(rèn)識(shí)其他參與人的策略選取,,但此時(shí)是一混合策略,,即參與人在其策略空間上的一個(gè)概率分布。在酒吧問題的博弈中不存在“純策略納什均衡”點(diǎn),,此時(shí)的參與人通過歸納法“認(rèn)識(shí)到”平均去酒吧的人數(shù)為"60%",即每次去酒吧的人數(shù)與不去酒吧的人數(shù)的“可能”比率為60:40,。
因此,,當(dāng)一個(gè)博弈存在純策略納什均衡時(shí),博弈各參與人通過對以往的博弈歷史的歸納,,制定出下次的策略均衡點(diǎn),,從而摸索著接近該均衡,最終達(dá)到一個(gè)純策略,。而當(dāng)博弈存在混合策略均衡時(shí),,博弈參與人所能夠做的只是逐漸認(rèn)識(shí)對方的混合策略,而相應(yīng)地制訂自己的混合策略,,最終達(dá)到混合策略均衡,。 這就是說,博弈中參與人運(yùn)用的歸納推理是有效的,,這種有效性是針對博弈均衡的認(rèn)識(shí)而言的,。
5 結(jié)語
逆向歸納法悖論只是博弈論中一個(gè)悖論而已,,歸納的合理性也只是多主體互動(dòng)時(shí)理性人進(jìn)行歸納推理的一個(gè)問題。博弈論涉及許多關(guān)于推理的邏輯“問題”,。本人希望我國有更多的邏輯研究人員參與到博弈邏輯的研究中來,,邏輯學(xué)家參與到博弈論的研究定能夠結(jié)出豐碩的研究成果。(潘天群)
【參考文獻(xiàn)】 [1]潘天群.博弈生存[M].北京:中央編譯出版杜,,2002. []Mamoru
Kaneko,Tekashi Nagashima.Game Logic and lts Applications Ⅰ[J]. Studia
Logica,vo157,1996.325-354. [3]Mamoru Kaneko, Takashi Nagashima. Game logic
and ItsApplications Ⅱ[J].Studia Logica,vo158,1997.273-303. []Bermudez.
Rationality and the Backwards Indution
Argument[J].Analysis,1999,59(4):243-248. [5]Arthur. Inductive Reasoning and
Bounded Rationality[J].American Economic Review, vo184,1994. 406. []Arthur.
Complexity and the Economy [J]. Science, Vol 284,1999.5411. |
|