【內(nèi)容提要】博弈論研究的是把自己的策略建立在假定對(duì)手會(huì)按其最佳利益行動(dòng)基礎(chǔ)上的策略理論。博弈論在現(xiàn)實(shí)社會(huì)經(jīng)濟(jì)生活中有著廣泛的適用范圍。本文從博弈論的含義入手分析了博弈論的基本原理,并在此基礎(chǔ)上針對(duì)一些現(xiàn)實(shí)社會(huì)經(jīng)濟(jì)生活中的問(wèn)題,運(yùn)用博弈論加以分析和思考。文章認(rèn)為應(yīng)該借鑒博弈論為我國(guó)經(jīng)濟(jì)建設(shè)服務(wù)。
【關(guān)鍵詞】博弈論? ? ? ? 社會(huì)經(jīng)濟(jì)生活? ? 市場(chǎng)
有人說(shuō)經(jīng)濟(jì)學(xué)就是一門研究如何做出選擇的學(xué)問(wèn)。在現(xiàn)實(shí)的社會(huì)經(jīng)濟(jì)生活中企業(yè)或個(gè)人為了自身利益的最大化面對(duì)市場(chǎng)會(huì)做出自己的最優(yōu)決策。不同的市場(chǎng)情形會(huì)影響經(jīng)濟(jì)主體人的決策行為。在完全競(jìng)爭(zhēng)市場(chǎng)條件下,企業(yè)會(huì)根據(jù)給定商品的市場(chǎng)價(jià)格計(jì)算出生產(chǎn)和供應(yīng)到市場(chǎng)上的商品的數(shù)量,以實(shí)現(xiàn)最大的利潤(rùn)。而寡頭市場(chǎng)的情形要比完全競(jìng)爭(zhēng)市場(chǎng)復(fù)雜的多。企業(yè)大量面對(duì)的是信息不完全的市場(chǎng)。企業(yè)不知道面對(duì)強(qiáng)大的競(jìng)爭(zhēng)對(duì)手該如何做出抉擇。市場(chǎng)的時(shí)效性又要求企業(yè)必須在信息不完全的情況下做出決策。在這樣的決策中存在著三個(gè)合理的假設(shè)為前提。第一是理性的“經(jīng)濟(jì)人”。每一個(gè)行為主體都依據(jù)自身利益的最大化作為行動(dòng)的出發(fā)點(diǎn)。第二是每一個(gè)行為主體做出的決策都不是在真空的世界中?,F(xiàn)實(shí)的世界使得一個(gè)人的生存必須以他人的生存為前提。這種相互依賴的關(guān)系使得一個(gè)行為主體的決策會(huì)對(duì)其他為主體產(chǎn)生重要的影響,同樣其他行為主體的決策也會(huì)直接影響著這個(gè)行為主體的決策結(jié)果。第三是寡頭市場(chǎng)的情形。也即一個(gè)行業(yè)里面只有少數(shù)幾家企業(yè),甚至只有兩三家企業(yè),每一方的市場(chǎng)份額都很大。由于競(jìng)爭(zhēng)對(duì)手很少,每一個(gè)主體的行為產(chǎn)生的后果受對(duì)手的行為的影響都很大。那么這樣的決策就帶有了博弈的色彩。
一、博弈論釋義
博弈論(game theory)所分析的就是兩個(gè)或兩個(gè)以上的比賽者或參與者選擇能夠共同影響每一個(gè)參加者的行動(dòng)或策略的方式。博弈論的核心思想是:假設(shè)你的對(duì)手在研究你的策略并追求自己最大利益行動(dòng)的時(shí)候,你如何選擇最有效的策略。舉例說(shuō)明:
(一)、囚徒困境
“囚徒困境”說(shuō)的是兩個(gè)囚徒一起做壞事,結(jié)果被警察發(fā)現(xiàn)抓了起來(lái),進(jìn)行隔離審訊。如果他們都承認(rèn)犯罪,每人將入獄三年;如果他們都不坦白,由于證據(jù)不充分,每人將只入獄一年;如果一個(gè)抵賴而另一個(gè)坦白并且愿意作證,那么抵賴者將入獄五年,而坦白者將得到寬大釋放。這樣兩個(gè)囚徒面臨著如何選擇的問(wèn)題。從表面上看,他們應(yīng)該互相合作,保持沉默,以便能得到自由。但他們不得不仔細(xì)考慮對(duì)方可能采取什么樣的選擇。甲犯不是個(gè)傻子,他馬上意識(shí)到,他根本無(wú)法相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù),然后獲釋而去,讓他獨(dú)自坐牢。這種想法的誘惑力實(shí)在太大了。但他也意識(shí)到,他的同伙也不是傻子,也會(huì)這樣來(lái)設(shè)想他。所以甲犯的結(jié)論是,唯一理性的選擇就是背叛同伙,把一切都告訴警方,因?yàn)槿绻耐锉康弥粫?huì)保持沉默,那么他就會(huì)是那個(gè)獲釋出獄的幸運(yùn)者了。而如果他的同伙也根據(jù)這個(gè)邏輯向警方交代了,那么,甲犯也只需服刑三年而不用五年。同樣乙犯也會(huì)有這樣的想法。結(jié)果只能是兩個(gè)囚犯都坐牢服刑三年。 用矩陣圖形來(lái)分析兩個(gè)囚徒選擇的根據(jù)。
乙
坦白? ? ? ? ? ? 抵賴
3? ? ? ? ? ? ? 5
坦白
3? ? ? ? ? ? ? 0
甲
0? ? ? ? ? ? ? 1
抵賴
5? ? ? ? ? ? ? 1
囚徒困境圖示
(圖中左下方的數(shù)字代表甲犯入獄的年限,右上方的數(shù)字代表乙犯入獄的年限)
對(duì)于甲來(lái)說(shuō)不管乙采取什么策略,他選擇坦白總是比較有利的。同樣對(duì)于乙來(lái)說(shuō)選擇坦白也是比較有利的。在圖中我們?cè)O(shè)想一下甲面臨的選擇。甲犯如果坦白,不論乙采取怎樣的選擇,甲的選擇總是最好的。甲如果抵賴,不論乙采取怎樣的選擇,甲的選擇總是最壞的。當(dāng)然會(huì)有人問(wèn)為什么兩個(gè)囚徒不選擇圖示中右下方區(qū)域呢?這個(gè)問(wèn)題方到后面來(lái)說(shuō)明。很顯然甲的選擇是一種占優(yōu)策略。在兩個(gè)(或全部)博弈者都采取占優(yōu)策略時(shí),我們稱其結(jié)果為一種占優(yōu)均衡。在圖示中左上方的區(qū)域代表的結(jié)果就是占優(yōu)均衡。因?yàn)檫M(jìn)行博弈的兩個(gè)囚徒都采用了占優(yōu)策略,從而造成了這種均衡狀態(tài)。從中我們還可以分析出每一個(gè)囚犯要想獲得最大的利益不僅取決于自己的策略,同時(shí)還取決于對(duì)手的策略。
(二)雙寡頭壟斷者是否會(huì)采用壟斷價(jià)格
假設(shè)市場(chǎng)上的供給只有兩個(gè)企業(yè)來(lái)提供,每一個(gè)企業(yè)具有相同的成本和需求結(jié)構(gòu),每個(gè)企業(yè)都將考慮是采用正常價(jià)格,還是抬高價(jià)格形成壟斷,并盡力獲取壟斷利潤(rùn)。用矩陣圖形來(lái)分析兩個(gè)企業(yè)進(jìn)行決策的根據(jù)。
乙
高價(jià)格? ? ? ? ? ? 正常價(jià)格
A? ? ? 200? B? ? ? ? 150
高價(jià)格
100? ? ? ? ? ? -20
甲
C? ? ? ? -30? D? ? ? ? ? 10
正常價(jià)格
150? ? ? ? ? ? 10
對(duì)抗博弈的圖示
(圖中左下方的數(shù)字代表甲企業(yè)獲利的數(shù)額,右上方的數(shù)字代表乙企業(yè)獲利的數(shù)額? ? 單位:萬(wàn)元)
在圖示中我們可以看到這兩個(gè)企業(yè)在A區(qū)域中有最大的聯(lián)合區(qū)域,在他們采用高價(jià)策略時(shí),共賺到300萬(wàn)元的利潤(rùn)。如果企業(yè)之間合謀并且設(shè)置壟斷價(jià)格,A區(qū)域中的情況就會(huì)出現(xiàn)。在另一個(gè)極端是采用正常價(jià)格競(jìng)爭(zhēng)策略的D區(qū)域,每個(gè)企業(yè)盈利10萬(wàn)元。在這一對(duì)抗博弈的例子中有兩種策略:即一個(gè)企業(yè)采用正常價(jià)格,另一個(gè)則采取高價(jià)格策略。例如在C區(qū)域中乙采用高價(jià)格策略,而甲則削價(jià)。甲占領(lǐng)了大部分市場(chǎng),并且賺取了最高利益,此時(shí)乙實(shí)際上虧損了。在B區(qū)域中甲以高價(jià)策略為賭注,而乙的正常價(jià)格則意味著甲的虧損。在這一例子中由于甲選擇了正常價(jià)格的占優(yōu)性策略,無(wú)論乙怎樣做,甲都會(huì)獲利較多。另一方面,乙沒有占優(yōu)性策略。這是因?yàn)槿绻撞捎谜r(jià)格策略,乙也要采用正常價(jià)格。如果甲實(shí)行高價(jià),乙也要實(shí)行高價(jià)。乙現(xiàn)在處在“兩難處境”之中。那么乙是否會(huì)采用高價(jià)策略,并希望甲也緊隨其后?或者為了安全而采用正常價(jià)格而出售?可以肯定的說(shuō),乙還是應(yīng)該以正常價(jià)格出售。這是因?yàn)橐視?huì)站在甲的立場(chǎng)上來(lái)考慮。無(wú)論乙采取何種策略,甲都會(huì)采用正常價(jià)格策略。這是甲的占優(yōu)策略。因此乙會(huì)假定甲將采取其占優(yōu)策略方式以找出自己的最佳策略。這種把自己的策略建立在假定對(duì)手會(huì)按其最佳利益行動(dòng)的基礎(chǔ)上來(lái)解決問(wèn)題的方法被稱為納什均衡(Nash equilibrium)。納什均衡也被稱為非合作性均衡,是指一個(gè)在其他博弈者的策略給定時(shí),沒有一方能夠改善自己的獲利的狀況。也就是說(shuō)在博弈者甲的策略已定時(shí),另一個(gè)對(duì)手不可能做得更好,反之亦然。每一種策略都是針對(duì)其對(duì)手策略的最佳反應(yīng)。在分析納什均衡的過(guò)程中我們可以看到每一方選擇策略時(shí)都沒有合謀,他們只是選擇對(duì)自身最有利的策略,而不會(huì)考慮社會(huì)福利或任何其他群體的利益。在圖示中我們還可以看到,無(wú)論是甲還是乙都無(wú)法從這種均衡(D區(qū)域)中得到更多的利潤(rùn)。如果甲轉(zhuǎn)移到高價(jià)格策略,他的利潤(rùn)就會(huì)由10萬(wàn)元變?yōu)?20萬(wàn)元,而當(dāng)乙從正常價(jià)格出售的納什均衡狀態(tài)抬高其價(jià)格時(shí),他的利潤(rùn)就會(huì)由10萬(wàn)元變?yōu)?30萬(wàn)元。同樣有人也會(huì)問(wèn)為什么雙方不選擇A區(qū)域中有最大的聯(lián)合區(qū)域?對(duì)于這個(gè)問(wèn)題也放到后面加以說(shuō)明。
綜合上述兩個(gè)例子我們引出了占優(yōu)策略和納什均衡的概念。不難看出在給定其他博弈者策略的前提下,當(dāng)沒有一方能夠改善其策略時(shí),才會(huì)出現(xiàn)納什均衡。而占優(yōu)策略則是指無(wú)論其他博弈者采取什么策略,該博弈者的策略總是最好的。對(duì)于納什均衡,我們說(shuō)企業(yè)是根據(jù)其競(jìng)爭(zhēng)者的策略而相應(yīng)采取的最佳策略;對(duì)于占優(yōu)策略,我們說(shuō)企業(yè)采取的什它能夠做到的最好的策略。因而可以說(shuō)占優(yōu)策略也是一種納什均衡。
現(xiàn)在來(lái)說(shuō)明非合作博弈的原因。在上述兩個(gè)例子中為什么甲乙雙方不能合作以取得雙方最大的利益呢?例如在雙寡頭壟斷模型中乙企業(yè)會(huì)決定試著降低產(chǎn)出,希望他的競(jìng)爭(zhēng)者也會(huì)這樣做,由此而提高市場(chǎng)價(jià)格。乙企業(yè)知道如果競(jìng)爭(zhēng)者不降低產(chǎn)出它的利潤(rùn)會(huì)降為-30萬(wàn)元。但是,他還是試了一下。在實(shí)踐中這個(gè)策略注定是要失敗的。我們分析一下雙寡頭壟斷模型的矩陣表就會(huì)知道原因是甲的占優(yōu)策略是遵循競(jìng)爭(zhēng)產(chǎn)出規(guī)則的。無(wú)論乙采取競(jìng)爭(zhēng)還是低產(chǎn)出以求壟斷,甲仍然會(huì)按照MC=P的 原則確定產(chǎn)出。完全競(jìng)爭(zhēng)市場(chǎng)中利潤(rùn)的刺激會(huì)導(dǎo)致企業(yè)走向有效的競(jìng)爭(zhēng)均衡或者稱之為非合作均衡。如果企業(yè)合謀或以協(xié)同的方式活動(dòng)時(shí),也即博弈雙方協(xié)調(diào)一致去尋找最大化共同利潤(rùn)的策略時(shí),就稱之為合作性均衡。當(dāng)然可以肯定的是盡管共同利益在協(xié)同性均衡狀態(tài)下達(dá)到最大化,但是社會(huì)總效用比競(jìng)爭(zhēng)均衡狀態(tài)下低。在現(xiàn)實(shí)中幾個(gè)大企業(yè)聯(lián)手或勾結(jié)起來(lái)形成行業(yè)的壟斷以謀求最大利潤(rùn)而結(jié)成的聯(lián)盟稱之為卡特爾。卡特爾的組織很不穩(wěn)定,每個(gè)企業(yè)都有強(qiáng)大的動(dòng)機(jī)去欺騙協(xié)議而轉(zhuǎn)向非合作均衡。除此以外卡特爾在許多情況下是非法行為。企業(yè)聯(lián)手抬高價(jià)格會(huì)損害消費(fèi)者的利益。政府鼓勵(lì)企業(yè)之間的競(jìng)爭(zhēng)有利于激勵(lì)企業(yè)改善經(jīng)營(yíng)管理,改進(jìn)技術(shù),降低成本,提高勞動(dòng)生產(chǎn)率,從而提高企業(yè)在市場(chǎng)中的競(jìng)爭(zhēng)力。大量存在而相互獨(dú)立的企業(yè)非合作行為有利于資源的有效配置。低產(chǎn)出和高價(jià)格的合謀或勾結(jié)將導(dǎo)致社會(huì)資源的嚴(yán)重浪費(fèi)以及消費(fèi)者的經(jīng)濟(jì)損失。因此在現(xiàn)實(shí)中政府一般都會(huì)實(shí)行反壟斷法來(lái)懲治那些合謀控制價(jià)格以企圖瓜分市場(chǎng)獲得高額壟斷利潤(rùn)經(jīng)濟(jì)主體。由于政府的力量也使得合謀或勾結(jié)變得非常困難。當(dāng)然這并不排除在現(xiàn)實(shí)中合作性博弈的出現(xiàn)。一般地,合作性博弈都發(fā)生在事關(guān)國(guó)計(jì)民生的重要行業(yè)或部門中間。這里不多加以分析。
二、博弈論在現(xiàn)實(shí)社會(huì)生活中的運(yùn)用
有的學(xué)者認(rèn)為博弈論已經(jīng)遍及經(jīng)濟(jì)學(xué)、社會(huì)科學(xué)、工商業(yè)活動(dòng)以及日常的生活之中。這樣理解也許有人會(huì)認(rèn)為照這樣說(shuō)博弈論無(wú)所不包了,其實(shí)也不然。但是 博弈論在社會(huì)生活中有著廣泛的用途卻是不爭(zhēng)的事實(shí)。從博弈論的角度可以解釋價(jià)格戰(zhàn)、污染環(huán)境、軍備競(jìng)賽、考試或體育競(jìng)技導(dǎo)致過(guò)多的參與者和加劇收入不平等……。限于篇幅,作者僅舉兩例來(lái)說(shuō)明博弈論在現(xiàn)實(shí)社會(huì)生活中的運(yùn)用。
(一)污染環(huán)境的博弈
如果考慮到外部性的經(jīng)濟(jì), 企業(yè)在不受到管制的環(huán)境里為了追求利潤(rùn)最大化,寧可污染環(huán)境,也不愿安裝昂貴的治污處理設(shè)備。在這種情況下,如果一個(gè)企業(yè)采取利他主義的態(tài)度治理污染,以圖改進(jìn)環(huán)境,那么它就會(huì)增加成本,提高產(chǎn)品價(jià)格,消費(fèi)者將逐漸轉(zhuǎn)移到其他競(jìng)爭(zhēng)者的手中。如果成本過(guò)高甚至還會(huì)出現(xiàn)破產(chǎn)或倒閉。在市場(chǎng)活動(dòng)中的企業(yè)首先要想辦法生存下來(lái),然后還要在競(jìng)爭(zhēng)中盡可能的淘汰對(duì)手,避免出局。這種思維策略會(huì)使得任何企業(yè)都不可能通過(guò)減少污染而增加利潤(rùn)。用矩陣圖形來(lái)加以說(shuō)明。
乙公司
低污染? ? ? ? ? ? 高污染
A? ? ? 200? B? ? ? ? 120
低污染
100? ? ? ? ? ? -30
甲公司
C? ? ? ? -30? D? ? ? ? ? 100
高污染
120? ? ? ? ? ? 100
污染博弈的圖示
(圖中左下方的數(shù)字代表甲企業(yè)治污獲利數(shù)額,右上方的數(shù)字代表乙企業(yè)治污獲利數(shù)額? 單位:萬(wàn)元)
從圖示中可以看到由于占優(yōu)策略發(fā)揮的作用,甲乙雙方都會(huì)采用D區(qū)域的方案。對(duì)于甲公司來(lái)說(shuō)不管乙公司采取什么策略,他選擇不治理污染(高污染)總是比較有利的。同樣對(duì)于乙來(lái)說(shuō)選擇不治理污染(高污染)也是比較有利的。這個(gè)圖示恰好與“囚徒困境”的圖示相反。在圖示中右下方的區(qū)域代表的結(jié)果才是占優(yōu)均衡。因?yàn)檫M(jìn)行博弈的兩個(gè)公司都采用了占優(yōu)策略,從而造成了這種均衡狀態(tài)。在這種情況下我們就會(huì)看出非合作或納什均衡是無(wú)效率的。在現(xiàn)實(shí)中當(dāng)市場(chǎng)活動(dòng)達(dá)到比較危險(xiǎn)的無(wú)效率地步,政府就應(yīng)該介入。通過(guò)設(shè)置有效的規(guī)章制度或排放收費(fèi),政府可以誘導(dǎo)企業(yè)向A區(qū)域移動(dòng)。例如我國(guó)在治理淮河污染的過(guò)程中考慮到經(jīng)濟(jì)的外在性,提出的一整套規(guī)章制度和排放收費(fèi)原則正是博弈論在現(xiàn)實(shí)中的要求和運(yùn)用。近期國(guó)務(wù)院環(huán)保部門為保護(hù)我國(guó)近海漁業(yè)資源而提出的“碧海藍(lán)天計(jì)劃”也同樣可以運(yùn)用上述理論加以說(shuō)明。
(二)勝者為王的博弈
在現(xiàn)實(shí)中人們往往可以看到北大、清華這樣的高等院校畢業(yè)生在擇業(yè)時(shí)會(huì)得到最好的職業(yè)而大多數(shù)其他名不見經(jīng)傳的院校畢業(yè)生只能求其次,或者很可能連對(duì)口的專業(yè)都找不到;一個(gè)超級(jí)明星每次出場(chǎng)費(fèi)可高達(dá)幾萬(wàn)元,而大多數(shù)演員只能拿到平均的工資。像這樣收入分配不平等的現(xiàn)象在現(xiàn)實(shí)中屢見不鮮。試用矩陣圖形來(lái)加以說(shuō)明。
冠軍
一般收益工作? ? ? ? ? 高收益工作
A? ? ? 50? ? B? ? ? ? 300
一般收益工作
50? ? ? ? ? ? ? 50
亞軍
C? ? ? ? 50? ? D? ? ? ? 300
高收益工作
200? ? ? ? ? ? ? 0
勝者為王的博弈圖示
(圖中左下方的數(shù)字代表亞軍獲得報(bào)酬的數(shù)額,右上方的數(shù)字代表冠軍軍獲得報(bào)酬的數(shù)額? 單位:萬(wàn)元)
在勝者為王的圖示中有才能的、有天賦的或者是機(jī)遇好的贏家有強(qiáng)大的動(dòng)力去參加勝者為王的比賽。高高在上的贏家在比賽中獲勝左面的亞軍有可能被引誘進(jìn)入高收益工作的行列。就如同太多的需求者去漁船追逐同一條魚,市場(chǎng)過(guò)于擁擠,最終得到的總收益很小。如果亞軍停留在一般收入標(biāo)準(zhǔn)的行業(yè)中,總收入會(huì)上升。圖示中右下角的D區(qū)域是勝者為王博弈的均衡狀態(tài)。對(duì)于冠軍來(lái)說(shuō),他總能夠得到高收益工作所以不會(huì)選擇一般收益工作。而對(duì)于亞軍來(lái)說(shuō),冠軍的示范作用是巨大的。他會(huì)認(rèn)為有同樣的機(jī)會(huì)獲勝,也會(huì)千方百計(jì)的加入到高收益工作的行列中。但是冠軍只有一個(gè),于是一個(gè)非效率的均衡產(chǎn)生了收入的最大不平等。究其原因在于市場(chǎng)那只“看不見的手”發(fā)揮激勵(lì)作用的同時(shí)也使得利潤(rùn)較高的職業(yè)吸引了過(guò)多的參與者,導(dǎo)致無(wú)效的消費(fèi)和投資。在現(xiàn)實(shí)中,我國(guó)高考現(xiàn)象和民工現(xiàn)象與此理論頗為相似。就乙高考現(xiàn)象為例:在改革開放至90年代期間,眾多的考生為了自己將來(lái)利益獲得的最大化紛紛報(bào)考重點(diǎn)大學(xué),而成功者甚微。造成家庭和社會(huì)資源的重大浪費(fèi)。近幾年來(lái)國(guó)家采取政策為避免資源的重大浪費(fèi)而采取了高校擴(kuò)招的策略。縱然面對(duì)高校未來(lái)幾年由于擴(kuò)招而帶來(lái)的壓力,但是權(quán)衡利弊,國(guó)家從宏觀上考慮做出的舉措還是有可取之處的。
三、結(jié)語(yǔ)
博弈論在理論上進(jìn)一步拓寬了經(jīng)濟(jì)學(xué)研究的領(lǐng)域和范圍,在實(shí)踐中也有著廣泛的運(yùn)用。在我國(guó)社會(huì)主義市場(chǎng)經(jīng)濟(jì)發(fā)展的今天,我們應(yīng)該借鑒博弈論中的基本原理提高資源的配置效率,發(fā)揮市場(chǎng)機(jī)制的作用,同時(shí)加強(qiáng)國(guó)家的宏觀調(diào)控,雙頭并舉,為我國(guó)經(jīng)濟(jì)建設(shè)發(fā)揮作用。
碼字好辛苦,感覺身體被掏空……不給點(diǎn)個(gè)我是不會(huì)起來(lái)的(葛優(yōu)躺ing),嗯,關(guān)注也要(?? ???)記得是關(guān)注專題民謠年代哦~^o^~