納什平衡,又稱為非合作賽局平衡,是博弈論的一個(gè)重要概念,以約翰·納什命名.
如果某情況下無一參與者可以獨(dú)自行動(dòng)而增加收益,則此策略組合被稱為納什均衡點(diǎn)
經(jīng)典的例子就是囚徒困境,囚徒困境是一個(gè)非零和博弈. 大意是:一個(gè)案子的兩個(gè)嫌疑犯被分開審訊,警官分別告訴兩個(gè)囚犯,如果你招供,而對(duì)方不招供,則你將被立即釋放,而對(duì)方將被判刑十年;如果兩人均招供,將均被判刑兩年.如果兩人均不招供,將最有利,只被判刑半年. 于是,兩人同時(shí)陷入招供還是不招供的兩難處境. 但兩人無法溝通,于是從各自的利益角度出發(fā),都依據(jù)各自的理性而選擇了招供, 這種情況就稱為納氏均衡點(diǎn). 這時(shí),個(gè)體的理性利益選擇是與整體的理性利益選擇不一致的.
學(xué)術(shù)爭(zhēng)議和批評(píng)
第一,納什(Nash)的關(guān)于非合作(non-cooperative)博弈論的平衡不動(dòng)點(diǎn)解(equilibrium/fixpoint)學(xué)術(shù)證明是非構(gòu)造性的(non-constructive),就是說納什用角谷靜夫不動(dòng)點(diǎn)定理(Kakutani fixed point theorem) 證明了平衡不動(dòng)點(diǎn)解是存在的,但卻不能指出以什么構(gòu)造算法如何去達(dá)到這個(gè)平衡不動(dòng)點(diǎn)解.這種非構(gòu)造性的發(fā)現(xiàn)對(duì)現(xiàn)實(shí)生活里的博弈的作用是有限的,即使知道平衡不動(dòng)點(diǎn)解存在,在很多情況下卻找不到,因此仍不能解決問題.[來源請(qǐng)求]在數(shù)學(xué)意義上,納什并沒有超越角谷靜夫不動(dòng)點(diǎn)定理.
經(jīng)過《美麗心靈》的Sylvia Nasar(書作者)和Ron Howard(電影作者)這樣的主流媒體的介入,角谷靜夫(Kakutani)在這些人的作品里被完全忽略.有人認(rèn)為,“納什平衡”(Nash equilibrium)的更合適的名字應(yīng)該叫作“角谷靜夫—納什博弈論不動(dòng)點(diǎn)”(Kakutani-Nash game-theoretic fixed point)或“角谷靜夫—納什平衡”(Kakutani-Nash equilibrium),沒有角谷靜夫不動(dòng)點(diǎn)定理,納什的證明沒有多大學(xué)術(shù)意義.《美麗心靈》完全忽視角谷靜夫之關(guān)鍵貢獻(xiàn)的作法有待商榷.
第二,納什的非合作(non-cooperative)博弈論模型僅僅是突破了博弈論中的一個(gè)局限.一個(gè)更大的局限是,博弈論面對(duì)的往往是由幾十億節(jié)點(diǎn)的龐大對(duì)象構(gòu)成的社會(huì)、經(jīng)濟(jì)等復(fù)雜行為,但馮·諾伊曼(Von Neumann)和納什的研究是針對(duì)兩三個(gè)節(jié)點(diǎn)的小規(guī)模博弈論(有人稱之為tiny-scale toy case).[來源請(qǐng)求]
這個(gè)假設(shè)的不完善處,可能比假設(shè)大家都是合作的(cooperative)更嚴(yán)重.因?yàn)樵诮?jīng)濟(jì)學(xué)里,一個(gè)龐大社會(huì)里的人極不可能全部都是合作的,非合作的情況通常在龐大對(duì)象的情形中更普遍,而在兩三個(gè)節(jié)點(diǎn)的小規(guī)模經(jīng)濟(jì)中倒反而影響較小.既然改了合作前提為非合作前提,卻仍然停留在兩三個(gè)節(jié)點(diǎn)的小規(guī)模博弈論中,這是一個(gè)不可忽視的缺陷.最近香港城市大學(xué)和北京清華大學(xué)的學(xué)者群鄧小鐵、姚期智在基于復(fù)雜度理論的大規(guī)模博弈論上有所進(jìn)展.
MIT的一位計(jì)算機(jī)科學(xué)博士生的博士論文(PDF http://people.csail.mit.edu/costis/thesis.pdf )——獲得2008年度美國(guó)計(jì)算機(jī)協(xié)會(huì)學(xué)位論文獎(jiǎng)——認(rèn)為經(jīng)濟(jì)學(xué)家的推測(cè)是錯(cuò)誤的,找到納什均衡點(diǎn)是幾乎不可能的事. 目前擔(dān)任MIT電機(jī)工程和計(jì)算機(jī)科學(xué)系助理教授的Constantinos Daskalakis與 UC伯克利的Christos Papadimitriou、英國(guó)利物浦大學(xué)的Paul Goldberg合作,證明對(duì)某些博弈來說,窮全世界所有計(jì)算機(jī)之力,在整個(gè)宇宙壽命的時(shí)間內(nèi)也計(jì)算不出納什均衡點(diǎn).Daskalakis相信,計(jì)算機(jī)找不到,人類也不可能找到.納什均衡屬于NP問題,Daskalakis證明它屬于NP問題的一個(gè)子集,不是通常認(rèn)為的NP-完全問題,而是PPAD-完全問題.這項(xiàng)研究成果被一些計(jì)算機(jī)科學(xué)家認(rèn)為是十年來博弈論領(lǐng)域的最大進(jìn)展.
不過在同一篇論文里,Daskalakis也指出,在參與者匿名的情況下,則僅需多項(xiàng)式時(shí)間即可逼近納什均衡.
現(xiàn)實(shí)的例子
上述例子可能顯得不甚自然,但現(xiàn)實(shí)中,無論是人類社會(huì)或大自然都可以找到類似囚徒困境的例子,將結(jié)果劃成同樣的支付矩陣.社會(huì)科學(xué)中的經(jīng)濟(jì)學(xué)、政治學(xué)和社會(huì)學(xué),以及自然科學(xué)的動(dòng)物行動(dòng)學(xué)、進(jìn)化生物學(xué)等學(xué)科,都可以用囚徒困境分析,模擬生物面對(duì)無止境的囚徒困境博弈.囚徒困境可以廣為使用,說明這種博弈的重要性.以下為各界例子:
[編輯] 政治學(xué)例子:軍備競(jìng)賽
在政治學(xué)中,兩國(guó)之間的軍備競(jìng)賽可以用囚徒困境來描述.兩國(guó)都可以聲稱有兩種選擇:增加軍備(背叛)、或是達(dá)成削減武器協(xié)議(合作).兩國(guó)都無法肯定對(duì)方會(huì)遵守協(xié)議,因此兩國(guó)最終會(huì)傾向增加軍備.似乎自相矛盾的是,雖然增加軍備會(huì)是兩國(guó)的“理性”行為,但結(jié)果卻顯得“非理性”(例如會(huì)對(duì)經(jīng)濟(jì)造成都有損壞等).這可視作遏制理論的推論,就是以強(qiáng)大的軍事力量來遏制對(duì)方的進(jìn)攻,以達(dá)到和平.
[編輯] 經(jīng)濟(jì)學(xué)例子:關(guān)稅戰(zhàn)
兩個(gè)國(guó)家,在關(guān)稅上可以有以兩個(gè)選擇:
提高關(guān)稅,以保護(hù)自己的商品.(背叛)
與對(duì)方達(dá)成關(guān)稅協(xié)定,降低關(guān)稅以利各自商品流通.(合作)
當(dāng)一國(guó)因某些因素不遵守關(guān)稅協(xié)定,而獨(dú)自提高關(guān)稅(背叛)時(shí),另一國(guó)也會(huì)作出同樣反應(yīng)(亦背叛),這就引發(fā)了關(guān)稅戰(zhàn),兩國(guó)的商品失去了對(duì)方的市場(chǎng),對(duì)本身經(jīng)濟(jì)也造成損害(共同背叛的結(jié)果).然后二國(guó)又重新達(dá)成關(guān)稅協(xié)定.(重復(fù)博弈的結(jié)果是將發(fā)現(xiàn)共同合作利益最大.)
[編輯] 商業(yè)例子:廣告戰(zhàn)
商業(yè)活動(dòng)中亦會(huì)出現(xiàn)各種囚徒困境例子.以廣告競(jìng)爭(zhēng)為例.
兩個(gè)公司互相競(jìng)爭(zhēng),二公司的廣告互相影響,即一公司的廣告較被顧客接受則會(huì)奪取對(duì)方的部分收入.但若二者同時(shí)期發(fā)出質(zhì)量類似的廣告,收入增加很少但成本增加.但若不提高廣告質(zhì)量,生意又會(huì)被對(duì)方奪走.
此二公司可以有二選擇:
互相達(dá)成協(xié)議,減少?gòu)V告的開支.(合作)
增加廣告開支,設(shè)法提升廣告的質(zhì)量,壓倒對(duì)方.(背叛)
若二公司不信任對(duì)方,無法合作,背叛成為支配性策略時(shí),二公司將陷入廣告戰(zhàn),而廣告成本的增加損害了二公司的收益,這就是陷入囚徒困境.在現(xiàn)實(shí)中,要二互相競(jìng)爭(zhēng)的公司達(dá)成合作協(xié)議是較為困難的,多數(shù)都會(huì)陷入囚徒困境中.
[編輯] 自行車賽例子
自行車賽事的比賽策略也是一種博弈,而其結(jié)果可用囚徒困境的研究成果解釋.例如每年都舉辦的環(huán)法自行車賽中有以下情況:選手們?cè)诘浇K點(diǎn)前的路程常以大隊(duì)伍(英文:Peloton)方式前進(jìn),他們采取這策略是為了令自己不至于太落后,又出力適中.而最前方的選手在迎風(fēng)時(shí)是最費(fèi)力的,所以選擇在前方是最差的策略.通常會(huì)發(fā)生這樣的情況,大家起先都不愿意向前(共同背叛),這使得全體速度很慢,而后通常會(huì)有二或多位選手騎到前面,然后一段時(shí)間內(nèi)互相交換最前方位置,以分擔(dān)風(fēng)的阻力(共同合作),使得全體的速度有所提升,而這時(shí)如果前方的其中一人試圖一直保持前方位置(背叛),其他選手以及大隊(duì)伍就會(huì)趕上(共同背叛).而通常的情況是,在最前面次數(shù)最多的選手(合作)通常會(huì)到最后被落后的選手趕上(背叛),因?yàn)楹竺娴倪x手騎在前面選手的沖流之中,比較不費(fèi)力.
[編輯] 與囚徒困境相關(guān)的各事件
[編輯] 異想
威廉·龐德斯通(William Poundstone)在他的著作中,以一新西蘭的例子來說明囚徒困境.在新西蘭,報(bào)亭既無管理員也不上鎖,買報(bào)紙的人自行放下錢后拿走報(bào)紙.當(dāng)然某些人可能取走報(bào)紙卻不付錢(背叛),但由于大家認(rèn)識(shí)到如果每個(gè)人都偷竊報(bào)紙(共同背叛)會(huì)造成以后不方便的有害結(jié)果,這種情形很少發(fā)生.這例子特別之處是新西蘭人并沒有被任何其他因素影響而能脫離囚徒困境.并沒有任何人特別去注意報(bào)亭,人們守規(guī)則是為了避免共同背叛帶來的惡果.這種避免囚徒困境的大家共同的推理或想法被稱為“異想(magical thinking)”.[3]
[編輯] “認(rèn)罪減刑”不可行
囚徒困境的結(jié)論是許多國(guó)家中認(rèn)罪減刑(英文:plea bargain)被禁止的原因之一.囚徒困境帶來的結(jié)論是:如果有二個(gè)罪犯,其中一人犯罪而另外一人是無辜的,犯罪者會(huì)為了減刑坦白一切甚至冤枉清白者(單獨(dú)背叛).最糟糕的情況是,如果他們二人都被判入獄,坦白的犯罪者刑期少,堅(jiān)持無罪的冤枉者刑期反而更多.
[編輯] 公用品悲劇
現(xiàn)實(shí)的博弈參與者不只一方,會(huì)有多方參與的囚徒困境.加勒特·詹姆斯·哈?。℅arrett James Hardin)的公用品悲劇就是一例:“公用品悲劇是指凡是屬于最多數(shù)人的公共財(cái)產(chǎn)常常是最少受人照顧的事物”,例如漁業(yè),公海中的魚是屬于公共的,而在本身不濫捕其他人也濫捕的思想下,漁民會(huì)沒有節(jié)制的大撈特?fù)?結(jié)果海洋生態(tài)破壞,漁民的生計(jì)也受影響(共同背叛的結(jié)果).但是,多方囚徒困境的提法有待商榷,因?yàn)槠淇偸强梢员环纸鉃橐唤M組經(jīng)典的二方囚徒困境.就是說只有二方的囚徒困境,沒有多方的.所謂多方的囚徒困境只是由多個(gè)二方囚徒困境混雜在一起而形成的錯(cuò)覺.
[編輯] 重復(fù)的囚徒困境
羅伯特·阿克塞爾羅德在其著作《合作的進(jìn)化》中,探索了經(jīng)典囚徒困境情景的一個(gè)擴(kuò)展,并把它稱作“重復(fù)的囚徒困境”(IPD).在這個(gè)博弈中,參與者必須反復(fù)地選擇他們彼此相關(guān)的策略,并且記住他們以前的對(duì)抗.阿克塞爾羅德邀請(qǐng)全世界的學(xué)術(shù)同行來設(shè)計(jì)計(jì)算機(jī)策略,并在一個(gè)重復(fù)囚徒困境競(jìng)賽中互相競(jìng)爭(zhēng).參賽的程序的差異廣泛地存在于這些方面:算法的復(fù)雜性、最初的對(duì)抗、寬恕的能力等等.
阿克塞爾羅德發(fā)現(xiàn),當(dāng)這些對(duì)抗被每個(gè)選擇不同策略的參與者一再重復(fù)了很長(zhǎng)時(shí)間之后,從利己的角度來判斷,最終“貪婪”策略趨向于減少,而比較“利他”策略更多地被采用.他用這個(gè)博弈來說明,通過自然選擇,一種利他行為的機(jī)制可能從最初純粹的自私機(jī)制進(jìn)化而來.
最佳確定性策略被認(rèn)為是“以牙還牙”,這是阿納托爾·拉波波特(Anatol Rapoport)開發(fā)并運(yùn)用到錦標(biāo)賽中的方法.它是所有參賽程序中最簡(jiǎn)單的,只包含了四行BASIC語(yǔ)言,并且贏得了比賽.這個(gè)策略只不過是在重復(fù)博弈的開頭合作,然后,采取你的對(duì)手前一回合的策略.更好些的策略是“寬恕地以牙還牙”.當(dāng)你的對(duì)手背叛,在下一回合中你無論如何要以小概率(大約是1%-5%)時(shí)而合作一下.這是考慮到偶爾要從循環(huán)背叛的受騙中復(fù)原.當(dāng)錯(cuò)誤傳達(dá)被引入博弈時(shí),“寬恕地以牙還牙”是最佳的.這意味著有時(shí)你的動(dòng)作被錯(cuò)誤地傳達(dá)給你的對(duì)手:你合作但是你的對(duì)手聽說你背叛了.
通過分析高分策略,阿克塞爾羅德指定了策略獲得成功的幾個(gè)必要條件.
友善
最重要的條件是策略必須“友善”,這就是說,不要在對(duì)手背叛之前先背叛.幾乎所有的高分策略都是友善的.因此,完全自私的策略僅僅出于自私的原因,也永遠(yuǎn)不會(huì)首先打擊其對(duì)手.
報(bào)復(fù)
但是,阿克斯洛德主張,成功的策略必須不是一個(gè)盲目樂觀者.要始終報(bào)復(fù).一個(gè)非報(bào)復(fù)策略的例子是始終合作.這是一個(gè)非常糟糕的選擇,因?yàn)椤跋铝鳌辈呗詫埧岬貏兿鬟@樣的傻瓜.
寬恕
成功策略的另一個(gè)品質(zhì)是必須要寬恕.雖然它們不報(bào)復(fù),但是如果對(duì)手不繼續(xù)背叛,它們會(huì)一再退卻到合作.這停止了報(bào)復(fù)和反報(bào)復(fù)的長(zhǎng)期進(jìn)行,最大化了得分點(diǎn)數(shù).
不嫉妒
最后一個(gè)品質(zhì)是不嫉妒,就是說不去爭(zhēng)取得到高于對(duì)手的分?jǐn)?shù)(對(duì)于“友善”的策略來說這也是不可能的,也就是說“友善”的策略永遠(yuǎn)無法得到高于對(duì)手的分?jǐn)?shù)).
因此,阿克塞爾羅德得到一種給人以烏托邦印象的結(jié)論,認(rèn)為自私的個(gè)人為了其自私的利益會(huì)趨向友善、寬恕和不嫉妒.阿克塞爾羅德關(guān)于重復(fù)囚徒困境的研究的重要結(jié)論之一,是友善的家伙能先完成交易.
重新考慮經(jīng)典的囚徒困境一節(jié)中給定的軍備競(jìng)賽模型:結(jié)論是,只是理性策略增進(jìn)了軍事力量,似乎兩個(gè)國(guó)家都寧可花費(fèi)其GDP在槍炮而不是黃油上.有趣的是,企圖說明對(duì)抗國(guó)家實(shí)際上以這種方式(在“重復(fù)囚徒困境假定”下的不同時(shí)期,軍費(fèi)支出在“高”和“低”之間反復(fù))競(jìng)賽的嘗試,卻經(jīng)常表明假定的軍備競(jìng)賽并沒有如預(yù)想的那樣出現(xiàn).(例如希臘人和土耳其人的軍費(fèi)支出,看來并不像遵循“以牙還牙”的重復(fù)囚徒困境式的軍備競(jìng)賽,卻更可能是被其國(guó)內(nèi)的政策所驅(qū)使.)這可能是一次性博弈和重復(fù)性博弈中的理性行為不同的例子.
對(duì)一次性囚徒困境博弈來說,最佳(點(diǎn)數(shù)最大化的)策略是簡(jiǎn)單地背叛;正如前面解釋的,無論對(duì)手的行動(dòng)可能是什么,這都是真實(shí)的.但是,在重復(fù)的囚徒困境博弈中,最佳策略依賴于可能的對(duì)手的策略,和他們?cè)鯓訉?duì)背叛和合作作出反應(yīng).例如,考慮這樣一個(gè)人群,那里每個(gè)人每次都背叛,除了一個(gè)人是遵循以牙還牙策略.這個(gè)人處于一種輕微的不利地位,因?yàn)榈谝换睾系膿p失.在這樣的人群中,對(duì)這個(gè)人來說最佳策略就是每次都背叛.在一個(gè)有一定的百分比的總背叛者而剩下的則是以牙還牙者的人群中,對(duì)個(gè)人來說的最佳策略依賴于這個(gè)百分比和博弈的長(zhǎng)度.
一般有兩種方法得到最佳策略:
貝葉斯納什均衡:如果對(duì)抗策略的統(tǒng)計(jì)分布能被確定(例如,50%以牙還牙,50%一直合作),就能從數(shù)學(xué)上獲得最佳的相對(duì)策略[4].
已經(jīng)有了人群的蒙特卡羅模擬,在這里低分個(gè)人消失了,高分個(gè)人一再被生產(chǎn)出來(一種獲得最佳策略的天才算法).決賽人群中的算法合成通常依賴于初賽人群中的算法合成.
盡管以牙還牙始終被認(rèn)為是最可靠的基本策略,但是在重復(fù)囚徒困境的20周年紀(jì)念賽中,來英國(guó)南安普敦大學(xué)的一個(gè)小組(由尼古拉斯·詹寧斯(Nicholas Jennings)[1]領(lǐng)導(dǎo),包括了拉蒂普·達(dá)什(Rajdeep Dash)、薩瓦帕里·拉姆瓊(Sarvapali Ramchurn)、亞歷克斯·羅杰斯(Alex Rogers)斯和皮魯克里士南·維特林根(Perukrishnen Vytelingum))介紹了一個(gè)新的策略,這個(gè)策略證明了它比以牙還牙更成功.這個(gè)策略依賴于程序之間的合作,為單一程序中獲得了最高的點(diǎn)數(shù).南安普敦大學(xué)提交了60個(gè)程序參與競(jìng)賽,這些程序的開頭被設(shè)計(jì)成通過一組5到10個(gè)的動(dòng)作去彼此識(shí)別.一旦這些識(shí)別被作出,一個(gè)程序?qū)⒖偸呛献?其他程序則總是背叛,保證背叛者得到最大的點(diǎn)數(shù).如果程序識(shí)別出它在操作一個(gè)非南安普敦參與者,這程序?qū)⒊掷m(xù)地背叛,企圖去最小化競(jìng)爭(zhēng)程序的得分.結(jié)果[5],這個(gè)策略以獲得前3位結(jié)束了競(jìng)賽,也得到了大量接近底部的位置.雖然這個(gè)策略顯著地證明了比以牙還牙有效,但是這是因?yàn)槔昧讼率鍪聦?shí):在這個(gè)特殊的競(jìng)賽中,多重通道是被允許的.在一方只能控制單一參與者的競(jìng)賽中,以牙還牙確實(shí)是更好的策略.
如果重復(fù)囚徒困境將被精確地重復(fù)N次,已知N是一個(gè)常數(shù),那么會(huì)產(chǎn)生另一個(gè)有趣的事實(shí).納什均衡就是每次都背叛.這很容易用歸納法證明.你也可以在最后的回合背叛,既然你的對(duì)手將沒有機(jī)會(huì)懲罰你.因此,你們都將在最后的回合背叛.這時(shí),你可以在倒數(shù)第二回合中背叛,既然最后一回?zé)o論你做什么,你的對(duì)手都將背叛.依此類推.為了合作以保持請(qǐng)求,這時(shí)未來必須對(duì)兩個(gè)參與者來說是不確定的.一個(gè)解決方案是讓博弈總次數(shù)N變成隨機(jī)的.對(duì)未來的預(yù)期必須是無法確定的長(zhǎng)度.
另一個(gè)單獨(dú)的案例是“永不停止”的囚徒困境.這個(gè)博弈被重復(fù)很多次,而且你的分?jǐn)?shù)是一個(gè)平均數(shù)(當(dāng)然是用計(jì)算機(jī)計(jì)算的).
囚徒困境博弈是某些人類合作和信任理論的基礎(chǔ).假定囚徒困境能夠模擬需要信任的兩人之間的交流,群體的合作行為可以用有多個(gè)參與者的、重復(fù)博弈的變體來模擬.這從而引起了許許多多學(xué)者經(jīng)久不衰的興趣.1975年,格羅夫曼(Grofman)和普爾(Pool)估計(jì),致力于這方面研究的學(xué)術(shù)文章,數(shù)量超過2000篇.
[編輯] 學(xué)習(xí)心理學(xué)和博弈論
當(dāng)博弈參與者能學(xué)會(huì)估計(jì)其他參與者背叛的可能性,他們自身的行為就為他們關(guān)于其他人的經(jīng)驗(yàn)所影響.簡(jiǎn)單的統(tǒng)計(jì)顯示,總體上,缺乏經(jīng)驗(yàn)的參與者與其他參與者的互動(dòng),或者是典型的好,或者是典型的壞.如果他們?cè)谶@些經(jīng)驗(yàn)的基礎(chǔ)上行動(dòng),(通過更多的背叛或合作,否則)他們可能在未來的交易中受損.隨著經(jīng)驗(yàn)逐漸豐富,他們獲得了對(duì)背叛可能性的更真實(shí)的印象,變得更成功地參與博弈.不成熟的參與者經(jīng)歷的早期交易對(duì)他們未來參與的影響,可能比這些交易對(duì)成熟的參與者的影響要大得多.這個(gè)原理部分地解釋了,為什么年輕人的成長(zhǎng)經(jīng)驗(yàn)這么具有影響力,以及為什么他們特別容易被欺負(fù),有時(shí)他們本身最后也成為欺凌弱小者.
群體中背叛的可能性,可以被合作的經(jīng)驗(yàn)所削弱[6],因?yàn)橄惹暗牟┺慕⒘诵湃?因此自我犧牲行為可以,例如,加強(qiáng)團(tuán)體的道德品質(zhì).如果團(tuán)體很小,積極行為更可能以互相肯定的方式——鼓勵(lì)這個(gè)團(tuán)體中的個(gè)人繼續(xù)合作——得到反饋.這與相似的困境有關(guān):鼓勵(lì)那些你將援助的人,從可能使他們處于危險(xiǎn)的境地的行為中得到滿足.這類方法主要在互惠利他主義、群選擇、血緣選擇和道德哲學(xué)的研究中涉及.
[編輯] 相關(guān)的博弈
[編輯] 封閉袋子交易
霍夫施塔特2曾提出像囚徒困境的問題.他提出“密封袋子交易”,他認(rèn)為以這簡(jiǎn)單博弈題,有助人們理解此論題.
“密封袋子交易”:甲、乙兩人面對(duì)面交換密封的袋子,雙方的共識(shí)是甲的袋放錢、乙的放商品.雙方各自可以誠(chéng)實(shí)地把東西放到袋子,然后交換;又或者交空袋子給對(duì)方,選擇背叛.
在這場(chǎng)博弈中,由于背叛可獲得巨大利益,必然有多人選擇背叛.這意味著理性的商人不會(huì)進(jìn)行這種交易,因而“封閉袋子交易”將由于逆向選擇而失去市場(chǎng).
[編輯] 是敵是友?
“是敵是友?”是一個(gè)競(jìng)賽表演節(jié)目,從2002年到2005年在美國(guó)競(jìng)賽表演廣播網(wǎng)(Game Show Network)放映.這是一個(gè)用真人進(jìn)行的囚徒困境博弈例子,不過情景是人造的.這個(gè)競(jìng)賽表演有三對(duì)人參與競(jìng)爭(zhēng).當(dāng)每對(duì)人被淘汰時(shí),他們做一個(gè)囚徒困境博弈,決定如何分他們的獎(jiǎng)品.如果他們都合作(“朋友”),他們的獎(jiǎng)品就被平分.如果一個(gè)合作而另一個(gè)背叛(“敵人”),背叛者得到所有的獎(jiǎng)品,合作者什么都得不到.如果雙方互相背叛,那么兩人都一無所獲.注意,這個(gè)支付矩陣與前述標(biāo)準(zhǔn)的支付矩陣不同,因?yàn)榘l(fā)生“互相背叛”的情形和“我合作而對(duì)手背叛”的情形,其損失是一樣的.和標(biāo)準(zhǔn)囚徒困境的穩(wěn)定均衡相比,“互相背叛”是不穩(wěn)固的均衡(weak equilibrium).如果你知道你的對(duì)手將成為“敵人”,這時(shí)你的選擇無法影響你的獎(jiǎng)品.在某種意義上,“是敵是友”擁有一個(gè)介于“囚徒困境”和“小雞”之間的支付模型.
這個(gè)支付矩陣是:
如果參與者都合作,每人得到 +1.
如果都背叛,每人得到 0.
如果甲合作而乙背叛,甲得到0而乙得到 +2.
是敵是友對(duì)于想對(duì)囚徒困境作現(xiàn)實(shí)分析的人將是有用的.注意到,參與者只能進(jìn)行一次,所以所有涉及重復(fù)進(jìn)行博弈的觀點(diǎn)都不適用,“以牙還牙”策略也無法發(fā)展出來.
在是敵是友中,每個(gè)參賽者被允許做一個(gè)聲明,使另一半友在雙方秘密決定合作或背叛之前,確信他的友善.可能“打破制度”的方法將是一個(gè)參與者告訴他的對(duì)手:“我會(huì)選擇做敵人.如果你相信我后來會(huì)和你分獎(jiǎng)品的話,就選擇做朋友.否則,如果你選擇做敵人,我們都會(huì)空手而回.”一個(gè)更貪婪的版本將是:“我將選擇做敵人.我會(huì)給你百分之X,剩下的百分之(100-X)歸我.所以,要或不要,要么我們都得到一些,要么我們都一無所獲.”(在最后通牒博弈中時(shí).)現(xiàn)在,奸計(jì)就是去盡量減少那個(gè)百分之X,并保持另一個(gè)競(jìng)爭(zhēng)者仍然選擇做朋友.基本上,這個(gè)參與者必須知道這個(gè)界限,在這里他的對(duì)手從看到他一無所獲中得到的效用,要超過他從肯定能贏得的金錢中得到的效用,如果他順利的話.
在競(jìng)賽中這個(gè)方法從未被試驗(yàn)過;可能是因?yàn)椴门袀儾粫?huì)允許,而且即使允許,不平等厭惡也會(huì)由于這個(gè)規(guī)則的使用而導(dǎo)致較低的期望收益.(最后通牒博弈中嘗試了這個(gè)方法,結(jié)果導(dǎo)致對(duì)高而不平等的出價(jià)的拒絕——在一些案例中,相當(dāng)于兩周的工資優(yōu)先于兩個(gè)參與者一無所獲被決絕.)
http://ent.sina.com.cn/m/2002-03-21/76881.html
納什均衡點(diǎn),應(yīng)怎樣理解
納什均衡點(diǎn),應(yīng)怎樣理解
請(qǐng)舉出具體的例子,
請(qǐng)舉出具體的例子,
語(yǔ)文人氣:602 ℃時(shí)間:2020-01-25 20:59:01
優(yōu)質(zhì)解答
我來回答
類似推薦
- 關(guān)于納什均衡
- 納什均衡的數(shù)學(xué)定義及經(jīng)濟(jì)含義是什么?
- cosAcosB+sinAsinB=1 可得到什么
- 作文:游大夫山350字
- 計(jì)算:666×778+333×444=_.
- n個(gè)數(shù)的和的各個(gè)數(shù)位的和,等于這幾個(gè)數(shù)字各數(shù)位的和嗎
- We should _______ ______ _______them.我們應(yīng)該友好的對(duì)待他們.
- 3fe2+ +2s2o3 2- +o2+xoH-1====fe3o4+S4O6 2- +2H2O 為什么說每生成1MOLfe3o4反應(yīng)轉(zhuǎn)移的電子數(shù)為 4MOL
- 仰角的概念
- be blessed with 的意思及用法
- 3分之2比五分之四是否等于3比2=4比5
- 物體所受的合外力越大,
猜你喜歡
- 1英語(yǔ)翻譯
- 2中國(guó)當(dāng)前的主要矛盾,是人們?nèi)找嬖鲩L(zhǎng)的物質(zhì)和文化生活和落后的社會(huì)生產(chǎn)之間的矛盾,具體表現(xiàn)在我們生活的哪些方面呢?
- 3如圖是一個(gè)平分角的儀器,其中AB=AD,BC=DC,將點(diǎn)A放在角的頂點(diǎn),AB和AD沿著角的兩邊放正,沿AC畫一條射線AE,AE就是角平分線,請(qǐng)說明它的道理.
- 4what are you busy ( ) i'm busy ( )my homework
- 5我賭你等不起怎么翻譯
- 61×3/1+3×5/1+5×7/1+...+99×101/1 的值
- 7沙塵暴給人類的危害
- 8求有“蒼穹”二字的詩(shī)詞成語(yǔ)
- 9四十五分之十四除以(五分之一加三分之一)
- 1026414: finally, don't panic, think about what you can achieve, not what you can't. positive thinking is important !
- 11成語(yǔ)中的名人故事的由來?
- 12向醋酸溶液中加水稀釋,參考書上說氫離子濃度增加,這是怎么回事?