博弈論又被稱為對策論(Game Theory)既是現(xiàn)代數(shù)學(xué)的一個新分支,也是運籌學(xué)的一個重要學(xué)科。
博弈論主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。 博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來理解和預(yù)測進(jìn)化論的某些結(jié)果。
博弈論已經(jīng)成為經(jīng)濟學(xué)的標(biāo)準(zhǔn)分析工具之一。在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟學(xué)[1]、國際關(guān)系、計算機科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。
基本概念中包括局中人、行動、信息、策略、收益、均衡和結(jié)果等。其中局中人、策略和收益是最基本要素。局中人、行動和結(jié)果被統(tǒng)稱為博弈規(guī)則。
這周主要介紹一下在信息對稱條件下的博弈論,以及在生活中的應(yīng)用。
在講博弈論之前,就不得不先提一下帕累托最優(yōu)(或者叫帕累托效率),人類社會的高度發(fā)展離不開人與人之間的高度協(xié)作,帕累托最優(yōu)往往更適用在內(nèi)部范圍探討,在雙方建立充分的信任的基礎(chǔ)之上的,這種“公平與效率的理想王國”,談的是合作,但促進(jìn)人類發(fā)展的不光只有協(xié)作,還有競爭。
亞當(dāng)斯密是古典經(jīng)濟學(xué)的創(chuàng)立者之一,他主張自由貿(mào)易,在市場這只無形的手的調(diào)節(jié)下,個體追求私利的行為,是在促進(jìn)社會的財富增長。
約翰·納什是一位經(jīng)濟學(xué)家,同時還是博弈論的創(chuàng)始人,說這些可能大家還都有點兒陌生,《美麗心靈》的主人公的原型就是他。他的理論在后來被成為“納什均衡”。
納什均衡,簡單來說,就是一種博弈的穩(wěn)定結(jié)果,誰單方改變策略,誰就會損失。
生活中到處都是“納什均衡”的例子:比如我國成立初期,大家一起吃大鍋飯,于是所有人在沒有有效監(jiān)督的情況下,偷懶就成了農(nóng)民的“最優(yōu)策略”,這就形成了一個”壞的納什均衡“。
解決這個的問題的方法,就是通過制度的改變,“包產(chǎn)到戶”,讓你偷懶分不到別人的勞動成果,農(nóng)民的“最優(yōu)策略“就是辛勤地勞動。
經(jīng)濟學(xué)課上講到了,每個人都會追求個人利益的最大化,反過來也可以說每個人在追求個人損失最小化,而這個損失最小化的行為,往往就會形成“壞的納什均衡”。
個人認(rèn)為,當(dāng)預(yù)期結(jié)果在我可控的情況下,人會追求個人利益的最大化,但是,在個人不可控的情況下,比如與不充分信任的人合作時,有時就會更傾向于追求個人損失最小化。
下面,我們通過一個例子了解一下納什均衡的兩方博弈:
在零售行業(yè)中,很多商家相互之間不斷的競爭博弈,有時大打價格戰(zhàn),就好比是七傷拳,傷人又傷己,這個時候,一些巨頭就會坐下來談判,制定協(xié)議,建立信任,這個時候,托斯拉就應(yīng)運而生。
托拉斯,英文trust的音譯,壟斷組織的一種高級形式,一些巨頭通過建立一種對他們有利的納什均衡,從而在市場沒有出現(xiàn)可替代品之前,形成一種短期的利潤最大化。
這個時候,政府可能就要出來干預(yù)了,說這種赤裸裸的壟斷是不可以的,于是他出臺《反壟斷法》,打破這種價格聯(lián)盟。
我們學(xué)過經(jīng)濟學(xué)的人都知道需求曲線,沒有什么需求是剛需,當(dāng)你通過壟斷漲價,必需品就會成為奢侈品,薛老師在專欄中說過,即使是壟斷,也會由市場最終作出調(diào)節(jié),讓最終的價格趨于正常化,但市場的反應(yīng)時間并不總是那么迅速,又價格上漲出現(xiàn)的需求降低并不是瞬間的,替代品的出現(xiàn)也不是一朝一夕的,在這個過渡期,商家就可以賺的盆滿缽滿,而政府在觀察到這個現(xiàn)象后,如果想改變這個納什均衡的方向,就必須制定相應(yīng)的策略,但我們知道,凡政策必遭遇對策,現(xiàn)實與預(yù)期往往有很大的差距,如何與利益集團進(jìn)行博弈,也成了政府的必修課之一。
政府希望通過制定政策,形成對消費者有利的納什均衡,而商家之間的聯(lián)盟,就是跟競爭對手之間,形成一種有利于自身的納什均衡。
看完納什均衡,你有什么感受,有沒有找到之間生活工作中對應(yīng)的例子呢?
接著我們再來講一下著名的囚徒困境
兩個共犯被抓住,并進(jìn)行審訊,在沒有提前溝通的情況下,他們面臨下面的選擇。

如果我們光看這幅圖,根據(jù)帕累托最優(yōu),他們的最佳方案就是兩人都選擇沉默,這樣兩人都只需要服役1年。
審訊者和囚徒之間,審訊者會刻意制造信息不對稱,甲乙雙方也沒有做好溝通,并且沒有絕對的信任,怕對方會出賣他,無法商量出這個合作解的帕累托最優(yōu)。這個時候,這個納什均衡就會倒向,兩人同時服刑8年。
在這個博弈中,我們可以看到兩點:
1、對于單個囚徒來說,背叛的誘惑(坦白)大于合作的報酬(判一年)
2、而受騙需要支付15年,大于背叛的懲罰8年
都背叛,是這個囚徒困境中唯一穩(wěn)定的納什均衡。
如果兩個囚徒是隸屬于一個黑社會組織—意大利黑手黨,那么這個黑幫就要想辦法破局,從制度上創(chuàng)造最利于自己的結(jié)果,也就是從上面兩點出發(fā)。
一、提高合作報酬,比如:照顧好囚徒的家眷,創(chuàng)造其在監(jiān)獄里更高的地位。
二、提高背叛懲罰,威脅他,背叛的話會在牢里被暗殺,妻兒不保。
囚徒困境為我們提供了一種改變納什均衡的思路
智豬博弈
"智豬博弈"由約翰·納什(JohnFNash),1950年提出。實際上小豬選擇等待,讓大豬去按控制按鈕,而自己選擇“坐船”(或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,小豬選擇等待的話,在大豬返回食槽之前,小豬可得到4個單位的純收益,大豬到達(dá)之后只能得到剩下的6個單位,實得4個單位;而小豬和大豬同時行動的話,則它們同時到達(dá)食槽,分別得到1個單位和5個單位的純收益;在大豬選擇等待的前提下,小豬如果行動的話,小豬在返回到達(dá)食槽之前,大豬已吃了9個單位,小豬只能吃到剩下的1個單位,則小豬的收入將不抵成本,純收益為-1單位,如果大豬也選擇等待的話,那么小豬的收益為零,成本也為零,總之,等待還是要優(yōu)于行動。
小豬的收益:小豬行動,大豬不行動<小豬大豬均不行動<小豬大豬一起行動<小豬不行動,大豬行動。
在這種博弈中,小豬明顯占據(jù)優(yōu)勢,在商業(yè)世界中,有很多的小豬都等著搭大豬的這個便車,來獲取自身的最大收益。
比如:新技術(shù)產(chǎn)品,大公司花巨資研發(fā),并砸錢打廣告,結(jié)果山寨產(chǎn)品幾乎在一夜之間就出來,山寨公司的這種行為就是搭便車,嚴(yán)重?fù)p害了大公司的利益,雖然這是公司之間的市場行為,但是小公司的這種行為,是不利于創(chuàng)新和良性發(fā)展的,小公司仿制沒有任何的風(fēng)險,大公司的利益受損,會嚴(yán)重的打擊大公司創(chuàng)新的積極性。
這種特殊的“納什均衡”,是不利于創(chuàng)新和發(fā)展的,所有政府會制定一些專利保護(hù)等相應(yīng)的制度,來掣肘這種“小豬心態(tài)”。
但即便有相應(yīng)的政策,很多在創(chuàng)業(yè)初期的小公司,還是會利用一些漏洞來搭便車,這是很多公司采用的策略,商業(yè)世界,永遠(yuǎn)是在不停地博弈。
公地悲?。?/b>由英國教授加勒特·哈丁在1968年率先提出
公地作為一項資源或財產(chǎn)有許多擁有者,他們中的每一個都有使用權(quán),但沒有權(quán)利阻止其他人使用,而每一個人都傾向于過度使用,從而造成資源的枯竭。過度砍伐的森林、過度捕撈的漁業(yè)資源及污染嚴(yán)重的河流和空氣,都是“公地悲劇”的典型例子。之所以叫悲劇,是因為每個當(dāng)事人都知道資源將由于過度使用而枯竭,但每個人對阻止事態(tài)的繼續(xù)惡化都感到無能為力。而且都抱著“及時撈一把”的心態(tài)加劇事態(tài)的惡化。公共物品因產(chǎn)權(quán)難以界定而被競爭性地過度使用或侵占是必然的結(jié)果。這一個概念經(jīng)常運用在區(qū)域經(jīng)濟學(xué),跨邊界資源管理等學(xué)術(shù)領(lǐng)域。
公地悲劇,是人們自私的避免損失最小的短期策略,導(dǎo)致公共資源走向耗盡,是一種典型的壞的“納什均衡”。
來說一個身邊的簡單例子。
單位院子里綠化帶種了很多果樹,你每天上班都會路過,眼看著果子一天天成熟,最優(yōu)的策略是等果子熟透了大家一起分了,但是每次果子還沒熟透,就已經(jīng)被人摘完了。
公地悲劇其實不光是對公共資源比如海洋、空氣、草場造成危害。其實很多公司在不經(jīng)意的制度設(shè)計中,也會產(chǎn)生一些“公地悲劇”政策。比如公共資金池,各個部門都會優(yōu)先申請,出于“反正我不用,就被別人用了”的心態(tài),造成一種資源的浪費,影響公司的收益。
所以,在對公共資源制定政策時,就要考慮如何避免公地悲劇的發(fā)生。
重復(fù)博弈
這個我就不引用度娘的定義了,重復(fù)博弈是相對一次博弈而言的,我舉幾個簡單的例子。
前幾年炒的沸沸揚揚的天價青島大蝦事件,對游客來說,強龍不壓地頭蛇,來過一次這輩子再來的可能性本身就微乎其微,而對商家來說,知道游客的心態(tài),多一事不如少一事,一次博弈就是最優(yōu)的博弈策略。
而當(dāng)我們?nèi)ゲ耸袌鲑I東西,就不會遇到這種情況,菜市場面對的是周邊生活圈的人,當(dāng)你跟老板討價還價時,老板會告訴你,我又不是在這里第一天做生意,我肯定希望你還來買,不會賣你貴的,這就是典型的重復(fù)博弈。
我們再來看下微商和淘寶賣家的區(qū)別,很多微商其實采取的就是一次博弈,逮住一個往死里宰,而淘寶網(wǎng)的點評系統(tǒng),其實就是讓商家杜絕一次博弈,提供優(yōu)質(zhì)的產(chǎn)品和服務(wù)。
從某種角度來說:誠信就是在商業(yè)世界重復(fù)博弈的一種心態(tài)。
以上內(nèi)容部分來自劉潤《五分鐘商學(xué)院》,同時加入了自己的案例和理解,下次再討論信息不對稱條件下的博弈。