博弈論與經(jīng)濟(jì)學(xué)思維(ppt)
綜合能力考核表詳細(xì)內(nèi)容
博弈論與經(jīng)濟(jì)學(xué)思維(ppt)
博弈論與經(jīng)濟(jì)學(xué)思維 2003年7月26-27日 湖北襄樊
楊云崗 博士
一、介紹博弈論
(一)概念,什么是博弈論 1.概念:博弈論Game Theory,又稱對(duì)策論,是使用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型研究沖突對(duì)抗條件下最優(yōu)決策問題的理論,是研究競爭的邏輯和規(guī)律的數(shù)學(xué)分支。簡單地說,博弈論是研究決策主體在給定信息結(jié)構(gòu)下如何決策以最大化自己的效用,以及不同決策主體之間決策的均衡。
張維迎的定義
“博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的”也就是說,當(dāng)一個(gè)主體,好比說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人、其他企業(yè)選擇的影響,而且反過來影響到其他人、其他企業(yè)選擇時(shí)的決策問題和均衡問題。所以在這個(gè)意義上說,博棄論又稱為“對(duì)策論”.
2.囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
囚徒困境說明了什么
在(坦白、坦白)這個(gè)組合中,A和B都不能通過單方面的改變行動(dòng)增加自己的收益,于是誰也沒有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡,也叫非合作均衡。
囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個(gè)"攻守同盟",但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒有人有積極性遵守這個(gè)協(xié)定,顯然最好的策略是雙方都抵賴.
囚徒困境的意義
“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。
對(duì)經(jīng)典經(jīng)濟(jì)學(xué)的沖擊
“納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。
《國富論》:“通過追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益。”
從“納什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。
怎么看待這個(gè)問題
二者是對(duì)立統(tǒng)一的,范圍不同,在非競爭環(huán)境中效率會(huì)受到損失;在完全競爭條件下,邊際利潤等于邊際成本,達(dá)到效率
NASH均衡條件下的行為規(guī)則
合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來對(duì)別人,但只有他們也按同樣方式行事才行。 所謂“己所不欲勿施于人”。但前提是人所不欲勿施于我。
3.博弈論的要素
博弈論的提法可能太過于學(xué)術(shù)化,容易讓人們退避三舍。其實(shí)它有一個(gè)非常通俗的名字--游戲理論(博弈論的英文名字叫做"Game Theory",如果直譯,就是"游戲理論")。博弈論在我國還有一個(gè)名字,叫對(duì)策論。這些名字都很好理解,博弈字面意思就是賭博、下棋,賭博和下棋當(dāng)然是游戲了,賭博和下棋的時(shí)候常常要千方百計(jì)地應(yīng)付對(duì)手,自然是要講究對(duì)策了。
參與人 players
一個(gè)博弈中的決策主體,他的目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用水平)。參與人可能是自然人,也可能是團(tuán)體,如企業(yè),國家等。
重要的是:每個(gè)參與人必須有可供選擇的行動(dòng)和一個(gè)很好定義的偏好函數(shù)。不做決策的被動(dòng)主體只能被當(dāng)作環(huán)境參數(shù)。
虛擬參與人pseudo-player
為了分析方便,自然nature被當(dāng)作虛擬參與人。
自然代表決定外生隨機(jī)變量的概率分布的機(jī)制。比如房地產(chǎn)開發(fā)中市場需求的大小。
行動(dòng) ACTIONS OR MOVES
參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。
(坦白)
N個(gè)參與人的行動(dòng)的有序集稱為行動(dòng)組合
(坦白,抵賴)。
行動(dòng)的順序
對(duì)于博弈的結(jié)果非常重要。有關(guān)靜態(tài)和動(dòng)態(tài)博弈的區(qū)分就是基于行動(dòng)的順序做出的。
同樣的行動(dòng)集合,行動(dòng)的順序不同,每個(gè)參與人的最有決策就不同,博弈的結(jié)果也不同。尤其在不完全信息博弈中,后行動(dòng)者依賴觀察先行動(dòng)者的行動(dòng)來獲取信息。
信息 information
參與人有關(guān)博弈的知識(shí),特別是有關(guān)自然的選擇,其他參與人的特征和行動(dòng)的知識(shí)。
完美信息perfect information:指一個(gè)參與人對(duì)其他參與人的行動(dòng)選擇有準(zhǔn)確的理解,即每個(gè)信息集只包含一個(gè)值。
共同知識(shí)common knowledge
所有參與人知道每一步的信息集。
戰(zhàn)略strategies
參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。
戰(zhàn)略與行動(dòng):戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。
在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。
戰(zhàn)略必須是完備的,要給出參與人在每一種可想象得到的情況下的行動(dòng)選擇。
支付payoff(效用utility)
在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平,或是指參與人得到的期望效用水平。
均衡equilibrium
指所有參與人的最優(yōu)戰(zhàn)略的組合。
(二)歷史沿革
猶太法典(Talmud)中一個(gè)男人如何將死后的財(cái)產(chǎn)發(fā)給三個(gè)妻子的難題 .
博弈理論開始于1944年由馮·諾依曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作的《博弈論和經(jīng)濟(jì)行為》(The Theory of Games and Economic Behaviour)一書的出版。
20世紀(jì)50年代以來,納什、澤爾騰、海薩尼等人使博弈論最終成熟并進(jìn)入實(shí)用。
三位大師主要的貢獻(xiàn)
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對(duì)競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。因?yàn)樵诂F(xiàn)實(shí)世界中,非合作博弈要比合作博弈普遍得多。
Selten and Harsanyi
澤爾騰(1965)將納什均衡的概念引入了動(dòng)態(tài)分析,提出了“精煉納什均衡”概念;以及進(jìn)一步刻畫不完全信息動(dòng)態(tài)博弈的“完備貝葉斯納什均衡”
而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(1967-1968)??傊?,他倆進(jìn)一步將納什均衡動(dòng)態(tài)化,加入了接近實(shí)際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型
(三)分類和主要思想
博弈論根據(jù)其所采用的假設(shè)不同而分為合作博弈理論和非合作博弈理論。兩者的區(qū)別在于參與人在博弈過程中是否能夠達(dá)成一個(gè)具有約束力的協(xié)議。倘若不能,則稱非合作博弈Non-Cooperative Game。
合作博弈強(qiáng)調(diào)的是集體主義,團(tuán)體理性Collective Rationality,是效率、公平、公正;
非合作博弈
而非合作博弈則主要研究人們?cè)诶嫦嗷ビ绊懙木謩葜腥绾芜x擇策略使得自己的收益最大,強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果是有時(shí)有效率,有時(shí)則不然。目前經(jīng)濟(jì)學(xué)家談到博弈論主要指的是非合作博弈,也就是各方在給定的約束條件下如何追求各自利益最大化,最后達(dá)到力量均衡。
例子
比如兩家企業(yè)A、B合作建設(shè)一條VCD的生產(chǎn)線,協(xié)議由A方提供生產(chǎn)VCD的技術(shù),B方則提供廠房和設(shè)備。在對(duì)技術(shù)和設(shè)備進(jìn)行資產(chǎn)評(píng)估時(shí)就形成非合作博弈,因?yàn)槊恳环蕉荚噲D最大化己方的評(píng)估值,這時(shí)B方如果能夠獲得A方關(guān)于技術(shù)的真實(shí)估價(jià)或參考報(bào)價(jià)這類競爭情報(bào),則可以使自己在評(píng)估中獲得優(yōu)勢;同理,A方也是一樣。至于自己的資產(chǎn)評(píng)估是否會(huì)影響合作企業(yè)的總體運(yùn)行效率這樣的"集體利益",則不會(huì)非常重視。這就是非合作博弈,參與人在選擇自己的行動(dòng)時(shí),優(yōu)先考慮的是如何維護(hù)自己的利益。
順序和信息
博弈論非常強(qiáng)調(diào)時(shí)間和信息的重要性,認(rèn)為時(shí)間和信息是影響博弈均衡的主要因素。在博弈過程中,參與者之間的信息傳遞決定了其行動(dòng)空間和最優(yōu)戰(zhàn)略的選擇;同時(shí),博弈過程中始終存在一個(gè)先后問題SequenceOrder,參與人的行動(dòng)次序?qū)Σ┺淖詈蟮木庥兄苯拥挠绊憽?
分類
博弈的劃分可以從參與人行動(dòng)的次序和參與人對(duì)其它參與人的特征、戰(zhàn)略空間和支付的知識(shí)、信息,是否了解兩個(gè)角度進(jìn)行。把兩個(gè)角度結(jié)合就得到了4種博弈:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈
博弈的分類及對(duì)應(yīng)的均衡
主要思想
博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它只是一種方法,這也是為什么許多人將其看成數(shù)學(xué)的一個(gè)分支的緣故。博弈論已經(jīng)在政治、經(jīng)濟(jì)、外交和社會(huì)學(xué)領(lǐng)域有了廣泛的應(yīng)用,它為解決不同實(shí)體的沖突和合作提供了一個(gè)寶貴的方法。
在對(duì)參與者行為研究這一點(diǎn)上,博弈論和經(jīng)濟(jì)學(xué)家的研究模式是完全一樣的。經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的相互影響和相互作用,人與人之間利益和沖突、競爭與合作,而這正是博弈論的研究對(duì)象。
我們從博弈中學(xué)習(xí)什么
博弈論告訴人們,要學(xué)會(huì)理解他人都有自己的思想,每個(gè)個(gè)體都是理性的,所以必須了解競爭對(duì)手的思想。商業(yè)關(guān)系被認(rèn)為是一種相互作用。但博弈論并不是療法,并不是處方,它并不告訴你該付多少錢買東西,這是計(jì)算機(jī)或者字典的任務(wù)。博弈論只是提供一些關(guān)系的例證,一些有用的解決問題的方法。這種思維方法也許是企業(yè)家應(yīng)該學(xué)習(xí)的。對(duì)于經(jīng)濟(jì)學(xué)家,也許需要學(xué)習(xí)它的理論模型,它的實(shí)驗(yàn)方式
幾個(gè)例子
1.囚徒困境在經(jīng)濟(jì)學(xué)和生活中的例子
中東石油輸出國 OPEC限產(chǎn)
幾乎所有的卡特爾都會(huì)遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟)不是一個(gè)納什均衡,沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了?理論上,如果是無限期的合作,雙方考慮長遠(yuǎn)利益,他們的合作是會(huì)成功的。但只要是有限次的合作,合作就不會(huì)成功。比如合作10次,那么在第九次博弈參與人就會(huì)采取不合作態(tài)度-----
參與者效用多重性,漂亮女生
價(jià)格戰(zhàn)
廠家價(jià)格大戰(zhàn)的結(jié)局也是一個(gè)“納什均衡”,而且價(jià)格戰(zhàn)的結(jié)果是誰都沒錢賺。因?yàn)椴┺碾p方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個(gè)“納什均衡”。這個(gè)結(jié)果可能對(duì)消費(fèi)者是有利的,但對(duì)廠商而言是災(zāi)難性的。所以,價(jià)格戰(zhàn)對(duì)廠商而言意味著自殺。
引伸出兩個(gè)問題,一是競爭削價(jià)的結(jié)果或“納什均衡”可能導(dǎo)致一個(gè)有效率的零利潤結(jié)局。
二是如果不采取價(jià)格戰(zhàn),作為一種敵對(duì)博弈論(rivalry game)其結(jié)果會(huì)如何呢?每一個(gè)企業(yè),都會(huì)考慮采取正常價(jià)格策略,還是采取高價(jià)格策略形成壟斷價(jià)格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會(huì)抬高價(jià)格。另一個(gè)極端的情況是廠商用正常的價(jià)格,雙方都可以獲得利潤。
有趣的聯(lián)系
我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對(duì)手會(huì)按其最佳利益行動(dòng)的基礎(chǔ)上”。事實(shí)上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個(gè)廠商或消費(fèi)者都是按照所有的別人已定的價(jià)格來進(jìn)行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費(fèi)者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價(jià)格等于邊際成本。
在完全競爭的情況下,非合作行為導(dǎo)致了社會(huì)所期望的經(jīng)濟(jì)效率狀態(tài)。如果廠商采取合作行動(dòng)并決定轉(zhuǎn)向壟斷價(jià)格,那么社會(huì)的經(jīng)濟(jì)效率就會(huì)遭到破壞。這就是為什么WTO和各國政府要加強(qiáng)反壟斷的意義所在。
占優(yōu)戰(zhàn)略
不論其他參與人選擇什么戰(zhàn)略,它的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。
重復(fù)剔除嚴(yán)格劣戰(zhàn)略
智豬博弈
每次按出10個(gè)蘿卜,按者支付2個(gè)單位成本,大先,(9,1)小先(6,4)同時(shí)(7,3)
小豬
實(shí)際生活中的智豬博弈
“搭便車”現(xiàn)象;
公共物品,窮人和富人修路博弈(中產(chǎn)階級(jí)對(duì)社會(huì)的穩(wěn)定作用);
大股東對(duì)管理者的監(jiān)督;
天塌下來有高個(gè)子頂著。
性別戰(zhàn)與先動(dòng)優(yōu)勢
雙均衡的性別戰(zhàn)
純戰(zhàn)略與混合戰(zhàn)略
如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng),稱為純戰(zhàn)略。
如果一個(gè)戰(zhàn)略規(guī)定參與人在給定的信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng),稱為混合戰(zhàn)略。
監(jiān)督博弈的納稅檢查
A 為應(yīng)納稅款,C為檢查成本, F是偷稅罰款。假定 C<A+F。不存在純戰(zhàn)略納什均衡。
納稅檢查邊際
S 為稅務(wù)機(jī)關(guān)檢查的概率,E為納稅人逃稅概率。給定E,稅收機(jī)關(guān)選擇檢查與否的期望收益:
K(1,E)=(A-C+F)E+(A-C)(1-E)
=EF+A-C
K(0,E)=0E+A(1-E)=A(1-E)
解K(1,E)= K(0,E),得:E=C/(A+F)納稅人逃稅概率小于E,稅收機(jī)關(guān)的最優(yōu)決策是不檢查,否則則反。
逃稅邊際
給定S,納稅人選擇逃稅與否的期望收益是:
K(S,1)=(-A-F)S+0(1-S)=-(A+F)S
K(S,0)=-AS+(-A)(1-S)=-A
解K(S,1)= K(S,0) ,得S=A/(A+F)即,如果稅收機(jī)關(guān)檢查的概率小于S,納稅人的最優(yōu)選擇是逃稅,否則交稅。
混合納什均衡是S,E,即稅收機(jī)關(guān)以S的概率查稅,而納稅人以E的概率逃稅。
污染博弈
貿(mào)易自由與壁壘
博弈論是一個(gè)強(qiáng)有力的分析工具。現(xiàn)在,它不僅在經(jīng)濟(jì)學(xué)領(lǐng)域、在軍事、政治、商業(yè)征戰(zhàn)、社會(huì)科學(xué)領(lǐng)域以及生物學(xué)等自然科學(xué)領(lǐng)域都有非常重大的影響,工程學(xué)中如控制論工程也少不了它。幫助大家形成博弈論的基本概念,實(shí)際上它是非常精深的?,F(xiàn)在與它緊密聯(lián)系的經(jīng)濟(jì)學(xué)分支是信息經(jīng)濟(jì)學(xué)。信號(hào)游戲、拍賣形式、激勵(lì)機(jī)制、委托人--代理人理論和公共財(cái)政學(xué)是博弈論和信息經(jīng)濟(jì)學(xué)研究的重要課題
對(duì)博弈論的兩種極端評(píng)價(jià)
從20世紀(jì)70年代末期,學(xué)者們逐漸形成一個(gè)共識(shí),當(dāng)一個(gè)人或群體與他或他們的博弈論對(duì)手都能以理性的方式做出決策行為的時(shí)候,那就是博弈論大顯身手的場合。
有人將博弈論比作Mendel的遺傳理論和Darwin的自然選擇對(duì)生物學(xué)的影響,或者Newton的天體力學(xué)對(duì)物理學(xué)的奠基作用。
真正的社會(huì)并不嚴(yán)格是博弈論的理想對(duì)象,無論是股票市場上的投機(jī)現(xiàn)象,還是受制于傳統(tǒng)文化的慣性影響下的體制選擇。如同混沌動(dòng)力系統(tǒng)理論帶給人們的初始興奮之后,博弈論并不具有有歷史上像物理學(xué)中理論的預(yù)測能力。
四.博弈論與運(yùn)籌學(xué)
運(yùn)籌學(xué)是近代應(yīng)用數(shù)學(xué)的一個(gè)分支,主要是將生產(chǎn)、管理等事件中出現(xiàn)的一些帶有普遍性的運(yùn)籌問題加以提煉,然后利用數(shù)學(xué)方法進(jìn)行解決。前者提供模型,后者提供理論和方法。
運(yùn)籌學(xué)本身也在不斷發(fā)展,現(xiàn)在已經(jīng)是一個(gè)包括好幾個(gè)分支的數(shù)學(xué)部門了。比如:數(shù)學(xué)規(guī)劃(又包含線性規(guī)劃;非線性規(guī)劃;整數(shù)規(guī)劃;組合規(guī)劃等)、圖論、網(wǎng)絡(luò)流、決策分析、排隊(duì)論、可靠性數(shù)學(xué)理論、庫存論、對(duì)策論、搜索論、模擬等等。
數(shù)學(xué)規(guī)劃
數(shù)學(xué)規(guī)劃的研究對(duì)象是計(jì)劃管理工作中有關(guān)安排和估值的問題,解決的主要問題是在給定條件下,按某一衡量指標(biāo)來尋找安排的最優(yōu)方案。它可以表示成求函數(shù)在滿足約束條件下的極大極小值問題。
排隊(duì)論
排隊(duì)論是運(yùn)籌學(xué)的又一個(gè)分支,它有叫做隨機(jī)服務(wù)系統(tǒng)理論。它的研究目的是要回答如何改進(jìn)服務(wù)機(jī)構(gòu)或組織被服務(wù)的對(duì)象,使得某種指標(biāo)達(dá)到最優(yōu)的問題。比如一個(gè)港口應(yīng)該有多少個(gè)碼頭,一個(gè)工廠應(yīng)該有多少維修人員等
搜索論
搜索論是由于第二次世界大戰(zhàn)中戰(zhàn)爭的需要而出現(xiàn)的運(yùn)籌學(xué)分支。主要研究在資源和探測手段受到限制的情況下,如何設(shè)計(jì)尋找某種目標(biāo)的最優(yōu)方案,并加以實(shí)施的理論和方法。在第二次世界大戰(zhàn)中,同盟國的空軍和海軍在研究如何針對(duì)軸心國的潛艇活動(dòng)、艦隊(duì)運(yùn)輸和兵力部署等進(jìn)行甄別的過程中產(chǎn)生的。搜索論在實(shí)際應(yīng)用中也取得了不少成效,例如二十世紀(jì)六十年代,美國尋找在大西洋失蹤的核潛艇“打谷者號(hào)”和“蝎子號(hào)”,以及在地中海尋找丟失的氫彈,都是依據(jù)搜索論獲得成功的。
五、完全信息動(dòng)態(tài)博弈
納什均衡的問題:多均衡、單選擇性(靜態(tài)性),不可置信威脅的存在性(市場進(jìn)入博弈)
澤爾騰剔除了不可置信威脅戰(zhàn)略,減少了納什均衡的個(gè)數(shù)
擴(kuò)展型表述的要素:參與人、參與人行動(dòng)的時(shí)點(diǎn)、行動(dòng)集合、信息,支付函數(shù)
子博弈精煉納什均衡
當(dāng)參與人的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成納什均衡。每一個(gè)子博弈都是最優(yōu)的。
城市姑娘愛上農(nóng)村小伙子導(dǎo)致姑娘父親的反應(yīng)。
承諾行動(dòng)(commitment),當(dāng)事人使自己威脅戰(zhàn)略變得可信的行為。
例子(要挾訴訟,曾諾行動(dòng)與精煉均衡的關(guān)系)
成功可能性非常小,目的是希望和解得到補(bǔ)償。
原告指控的目的本身意味著TX<P,原告將選擇放棄。子博弈精煉納什均衡是:原告選擇(不指控,要求,放棄),被告選擇(拒絕);均衡結(jié)果為原告不指控。
承諾行為,如果原告將P提前支付,TX-C-P>-C-P,只要?jiǎng)僭V的可能大于0,原告將起訴。如果S<TX+D,被告將接受原告的賠償請(qǐng)求。S的范圍(TX,TX+D),賠償結(jié)果為TX+D/2
如果TX+D/2>C+P,原告提起訴訟;即使TX<C+P,由于D值大, TX+D/2>C+P仍有可能。( TX+D/2-C-P,-TX-D/2)案件私了。
不完全信息靜態(tài)博弈
不了解對(duì)方的偏好、戰(zhàn)略空間及各種戰(zhàn)略組合下的利潤水平。
市場進(jìn)入博弈
海薩尼轉(zhuǎn)換
引入虛擬參與人“自然”
在所有后果間是無差異的。
自然的選擇提供了被選擇的參與人真實(shí)類型的概率分布。
分布函數(shù)是共同知識(shí)。
“不完全信息”轉(zhuǎn)換為“完全但不完美信息”
貝葉斯納什均衡Bayesian equilibrium
給定自己的類型和對(duì)方類型的概率分布的情況下,每個(gè)參與者的期望效用達(dá)到了最大化,沒有人有積極性選擇其他戰(zhàn)略的類型戰(zhàn)略依存組合。
期望利潤=40x+(-10)(1-x)
不完全信息動(dòng)態(tài)博弈 -----精煉貝葉斯納什均衡
壟斷限價(jià)模型(低成本價(jià)格與高成本價(jià)格透露的信息)
信號(hào)傳遞模型
成本的信息含量
求愛博弈
如果男人是柳下惠,女人穿少的時(shí)候他會(huì)看的概率是20%;如果男人是登徒子,女人穿少的時(shí)候他會(huì)看的概率是100%。
女人根據(jù)現(xiàn)有的信息判斷男人是柳下惠的概率為70%,因此女人估計(jì)自己穿少的時(shí)候,男人看的概率為:0.7*0.2+0.3*1=0.44
這是女人給定男人所屬類型的先驗(yàn)概率下,男人可能采取看的概率。
續(xù)
當(dāng)男人的確看了的時(shí)候,使用貝葉斯法則,根據(jù)男人看的這一行動(dòng),女人認(rèn)為男人是柳下惠的概率變?yōu)椋?
0.7*0.2/0.44=0.32
根據(jù)這一新的概念,女人估計(jì)自己穿少的時(shí)候男人會(huì)刊的概率為:
0.32*0.2+0.68*1=0.744
如果女人將這種行為再重復(fù)一次,男人又看了,則女人認(rèn)為男人是柳下惠的概率變?yōu)椋?
0.32*0.2/0.744=0.086
這樣女人通過男人一次次的看的行為,越來越認(rèn)為男人是登徒子而不是柳下惠。
這就是參與人行為傳遞信息的作用。
謝謝大家
楊云崗13701246658
willoowin@hotmail.com
博弈論與經(jīng)濟(jì)學(xué)思維(ppt)
博弈論與經(jīng)濟(jì)學(xué)思維 2003年7月26-27日 湖北襄樊
楊云崗 博士
一、介紹博弈論
(一)概念,什么是博弈論 1.概念:博弈論Game Theory,又稱對(duì)策論,是使用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型研究沖突對(duì)抗條件下最優(yōu)決策問題的理論,是研究競爭的邏輯和規(guī)律的數(shù)學(xué)分支。簡單地說,博弈論是研究決策主體在給定信息結(jié)構(gòu)下如何決策以最大化自己的效用,以及不同決策主體之間決策的均衡。
張維迎的定義
“博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的”也就是說,當(dāng)一個(gè)主體,好比說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人、其他企業(yè)選擇的影響,而且反過來影響到其他人、其他企業(yè)選擇時(shí)的決策問題和均衡問題。所以在這個(gè)意義上說,博棄論又稱為“對(duì)策論”.
2.囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
囚徒困境說明了什么
在(坦白、坦白)這個(gè)組合中,A和B都不能通過單方面的改變行動(dòng)增加自己的收益,于是誰也沒有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡,也叫非合作均衡。
囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個(gè)"攻守同盟",但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒有人有積極性遵守這個(gè)協(xié)定,顯然最好的策略是雙方都抵賴.
囚徒困境的意義
“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。
對(duì)經(jīng)典經(jīng)濟(jì)學(xué)的沖擊
“納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。
《國富論》:“通過追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益。”
從“納什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。
怎么看待這個(gè)問題
二者是對(duì)立統(tǒng)一的,范圍不同,在非競爭環(huán)境中效率會(huì)受到損失;在完全競爭條件下,邊際利潤等于邊際成本,達(dá)到效率
NASH均衡條件下的行為規(guī)則
合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來對(duì)別人,但只有他們也按同樣方式行事才行。 所謂“己所不欲勿施于人”。但前提是人所不欲勿施于我。
3.博弈論的要素
博弈論的提法可能太過于學(xué)術(shù)化,容易讓人們退避三舍。其實(shí)它有一個(gè)非常通俗的名字--游戲理論(博弈論的英文名字叫做"Game Theory",如果直譯,就是"游戲理論")。博弈論在我國還有一個(gè)名字,叫對(duì)策論。這些名字都很好理解,博弈字面意思就是賭博、下棋,賭博和下棋當(dāng)然是游戲了,賭博和下棋的時(shí)候常常要千方百計(jì)地應(yīng)付對(duì)手,自然是要講究對(duì)策了。
參與人 players
一個(gè)博弈中的決策主體,他的目的是通過選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用水平)。參與人可能是自然人,也可能是團(tuán)體,如企業(yè),國家等。
重要的是:每個(gè)參與人必須有可供選擇的行動(dòng)和一個(gè)很好定義的偏好函數(shù)。不做決策的被動(dòng)主體只能被當(dāng)作環(huán)境參數(shù)。
虛擬參與人pseudo-player
為了分析方便,自然nature被當(dāng)作虛擬參與人。
自然代表決定外生隨機(jī)變量的概率分布的機(jī)制。比如房地產(chǎn)開發(fā)中市場需求的大小。
行動(dòng) ACTIONS OR MOVES
參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。
(坦白)
N個(gè)參與人的行動(dòng)的有序集稱為行動(dòng)組合
(坦白,抵賴)。
行動(dòng)的順序
對(duì)于博弈的結(jié)果非常重要。有關(guān)靜態(tài)和動(dòng)態(tài)博弈的區(qū)分就是基于行動(dòng)的順序做出的。
同樣的行動(dòng)集合,行動(dòng)的順序不同,每個(gè)參與人的最有決策就不同,博弈的結(jié)果也不同。尤其在不完全信息博弈中,后行動(dòng)者依賴觀察先行動(dòng)者的行動(dòng)來獲取信息。
信息 information
參與人有關(guān)博弈的知識(shí),特別是有關(guān)自然的選擇,其他參與人的特征和行動(dòng)的知識(shí)。
完美信息perfect information:指一個(gè)參與人對(duì)其他參與人的行動(dòng)選擇有準(zhǔn)確的理解,即每個(gè)信息集只包含一個(gè)值。
共同知識(shí)common knowledge
所有參與人知道每一步的信息集。
戰(zhàn)略strategies
參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。
戰(zhàn)略與行動(dòng):戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。
在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。
戰(zhàn)略必須是完備的,要給出參與人在每一種可想象得到的情況下的行動(dòng)選擇。
支付payoff(效用utility)
在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平,或是指參與人得到的期望效用水平。
均衡equilibrium
指所有參與人的最優(yōu)戰(zhàn)略的組合。
(二)歷史沿革
猶太法典(Talmud)中一個(gè)男人如何將死后的財(cái)產(chǎn)發(fā)給三個(gè)妻子的難題 .
博弈理論開始于1944年由馮·諾依曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作的《博弈論和經(jīng)濟(jì)行為》(The Theory of Games and Economic Behaviour)一書的出版。
20世紀(jì)50年代以來,納什、澤爾騰、海薩尼等人使博弈論最終成熟并進(jìn)入實(shí)用。
三位大師主要的貢獻(xiàn)
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對(duì)競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。因?yàn)樵诂F(xiàn)實(shí)世界中,非合作博弈要比合作博弈普遍得多。
Selten and Harsanyi
澤爾騰(1965)將納什均衡的概念引入了動(dòng)態(tài)分析,提出了“精煉納什均衡”概念;以及進(jìn)一步刻畫不完全信息動(dòng)態(tài)博弈的“完備貝葉斯納什均衡”
而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(1967-1968)??傊?,他倆進(jìn)一步將納什均衡動(dòng)態(tài)化,加入了接近實(shí)際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型
(三)分類和主要思想
博弈論根據(jù)其所采用的假設(shè)不同而分為合作博弈理論和非合作博弈理論。兩者的區(qū)別在于參與人在博弈過程中是否能夠達(dá)成一個(gè)具有約束力的協(xié)議。倘若不能,則稱非合作博弈Non-Cooperative Game。
合作博弈強(qiáng)調(diào)的是集體主義,團(tuán)體理性Collective Rationality,是效率、公平、公正;
非合作博弈
而非合作博弈則主要研究人們?cè)诶嫦嗷ビ绊懙木謩葜腥绾芜x擇策略使得自己的收益最大,強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果是有時(shí)有效率,有時(shí)則不然。目前經(jīng)濟(jì)學(xué)家談到博弈論主要指的是非合作博弈,也就是各方在給定的約束條件下如何追求各自利益最大化,最后達(dá)到力量均衡。
例子
比如兩家企業(yè)A、B合作建設(shè)一條VCD的生產(chǎn)線,協(xié)議由A方提供生產(chǎn)VCD的技術(shù),B方則提供廠房和設(shè)備。在對(duì)技術(shù)和設(shè)備進(jìn)行資產(chǎn)評(píng)估時(shí)就形成非合作博弈,因?yàn)槊恳环蕉荚噲D最大化己方的評(píng)估值,這時(shí)B方如果能夠獲得A方關(guān)于技術(shù)的真實(shí)估價(jià)或參考報(bào)價(jià)這類競爭情報(bào),則可以使自己在評(píng)估中獲得優(yōu)勢;同理,A方也是一樣。至于自己的資產(chǎn)評(píng)估是否會(huì)影響合作企業(yè)的總體運(yùn)行效率這樣的"集體利益",則不會(huì)非常重視。這就是非合作博弈,參與人在選擇自己的行動(dòng)時(shí),優(yōu)先考慮的是如何維護(hù)自己的利益。
順序和信息
博弈論非常強(qiáng)調(diào)時(shí)間和信息的重要性,認(rèn)為時(shí)間和信息是影響博弈均衡的主要因素。在博弈過程中,參與者之間的信息傳遞決定了其行動(dòng)空間和最優(yōu)戰(zhàn)略的選擇;同時(shí),博弈過程中始終存在一個(gè)先后問題SequenceOrder,參與人的行動(dòng)次序?qū)Σ┺淖詈蟮木庥兄苯拥挠绊憽?
分類
博弈的劃分可以從參與人行動(dòng)的次序和參與人對(duì)其它參與人的特征、戰(zhàn)略空間和支付的知識(shí)、信息,是否了解兩個(gè)角度進(jìn)行。把兩個(gè)角度結(jié)合就得到了4種博弈:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈
博弈的分類及對(duì)應(yīng)的均衡
主要思想
博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它只是一種方法,這也是為什么許多人將其看成數(shù)學(xué)的一個(gè)分支的緣故。博弈論已經(jīng)在政治、經(jīng)濟(jì)、外交和社會(huì)學(xué)領(lǐng)域有了廣泛的應(yīng)用,它為解決不同實(shí)體的沖突和合作提供了一個(gè)寶貴的方法。
在對(duì)參與者行為研究這一點(diǎn)上,博弈論和經(jīng)濟(jì)學(xué)家的研究模式是完全一樣的。經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向人與人關(guān)系的研究,特別是人與人之間行為的相互影響和相互作用,人與人之間利益和沖突、競爭與合作,而這正是博弈論的研究對(duì)象。
我們從博弈中學(xué)習(xí)什么
博弈論告訴人們,要學(xué)會(huì)理解他人都有自己的思想,每個(gè)個(gè)體都是理性的,所以必須了解競爭對(duì)手的思想。商業(yè)關(guān)系被認(rèn)為是一種相互作用。但博弈論并不是療法,并不是處方,它并不告訴你該付多少錢買東西,這是計(jì)算機(jī)或者字典的任務(wù)。博弈論只是提供一些關(guān)系的例證,一些有用的解決問題的方法。這種思維方法也許是企業(yè)家應(yīng)該學(xué)習(xí)的。對(duì)于經(jīng)濟(jì)學(xué)家,也許需要學(xué)習(xí)它的理論模型,它的實(shí)驗(yàn)方式
幾個(gè)例子
1.囚徒困境在經(jīng)濟(jì)學(xué)和生活中的例子
中東石油輸出國 OPEC限產(chǎn)
幾乎所有的卡特爾都會(huì)遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟)不是一個(gè)納什均衡,沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了?理論上,如果是無限期的合作,雙方考慮長遠(yuǎn)利益,他們的合作是會(huì)成功的。但只要是有限次的合作,合作就不會(huì)成功。比如合作10次,那么在第九次博弈參與人就會(huì)采取不合作態(tài)度-----
參與者效用多重性,漂亮女生
價(jià)格戰(zhàn)
廠家價(jià)格大戰(zhàn)的結(jié)局也是一個(gè)“納什均衡”,而且價(jià)格戰(zhàn)的結(jié)果是誰都沒錢賺。因?yàn)椴┺碾p方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個(gè)“納什均衡”。這個(gè)結(jié)果可能對(duì)消費(fèi)者是有利的,但對(duì)廠商而言是災(zāi)難性的。所以,價(jià)格戰(zhàn)對(duì)廠商而言意味著自殺。
引伸出兩個(gè)問題,一是競爭削價(jià)的結(jié)果或“納什均衡”可能導(dǎo)致一個(gè)有效率的零利潤結(jié)局。
二是如果不采取價(jià)格戰(zhàn),作為一種敵對(duì)博弈論(rivalry game)其結(jié)果會(huì)如何呢?每一個(gè)企業(yè),都會(huì)考慮采取正常價(jià)格策略,還是采取高價(jià)格策略形成壟斷價(jià)格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會(huì)抬高價(jià)格。另一個(gè)極端的情況是廠商用正常的價(jià)格,雙方都可以獲得利潤。
有趣的聯(lián)系
我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對(duì)手會(huì)按其最佳利益行動(dòng)的基礎(chǔ)上”。事實(shí)上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個(gè)廠商或消費(fèi)者都是按照所有的別人已定的價(jià)格來進(jìn)行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費(fèi)者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價(jià)格等于邊際成本。
在完全競爭的情況下,非合作行為導(dǎo)致了社會(huì)所期望的經(jīng)濟(jì)效率狀態(tài)。如果廠商采取合作行動(dòng)并決定轉(zhuǎn)向壟斷價(jià)格,那么社會(huì)的經(jīng)濟(jì)效率就會(huì)遭到破壞。這就是為什么WTO和各國政府要加強(qiáng)反壟斷的意義所在。
占優(yōu)戰(zhàn)略
不論其他參與人選擇什么戰(zhàn)略,它的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。
重復(fù)剔除嚴(yán)格劣戰(zhàn)略
智豬博弈
每次按出10個(gè)蘿卜,按者支付2個(gè)單位成本,大先,(9,1)小先(6,4)同時(shí)(7,3)
小豬
實(shí)際生活中的智豬博弈
“搭便車”現(xiàn)象;
公共物品,窮人和富人修路博弈(中產(chǎn)階級(jí)對(duì)社會(huì)的穩(wěn)定作用);
大股東對(duì)管理者的監(jiān)督;
天塌下來有高個(gè)子頂著。
性別戰(zhàn)與先動(dòng)優(yōu)勢
雙均衡的性別戰(zhàn)
純戰(zhàn)略與混合戰(zhàn)略
如果一個(gè)戰(zhàn)略規(guī)定參與人在每一個(gè)給定的信息情況下只選擇一種特定的行動(dòng),稱為純戰(zhàn)略。
如果一個(gè)戰(zhàn)略規(guī)定參與人在給定的信息情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng),稱為混合戰(zhàn)略。
監(jiān)督博弈的納稅檢查
A 為應(yīng)納稅款,C為檢查成本, F是偷稅罰款。假定 C<A+F。不存在純戰(zhàn)略納什均衡。
納稅檢查邊際
S 為稅務(wù)機(jī)關(guān)檢查的概率,E為納稅人逃稅概率。給定E,稅收機(jī)關(guān)選擇檢查與否的期望收益:
K(1,E)=(A-C+F)E+(A-C)(1-E)
=EF+A-C
K(0,E)=0E+A(1-E)=A(1-E)
解K(1,E)= K(0,E),得:E=C/(A+F)納稅人逃稅概率小于E,稅收機(jī)關(guān)的最優(yōu)決策是不檢查,否則則反。
逃稅邊際
給定S,納稅人選擇逃稅與否的期望收益是:
K(S,1)=(-A-F)S+0(1-S)=-(A+F)S
K(S,0)=-AS+(-A)(1-S)=-A
解K(S,1)= K(S,0) ,得S=A/(A+F)即,如果稅收機(jī)關(guān)檢查的概率小于S,納稅人的最優(yōu)選擇是逃稅,否則交稅。
混合納什均衡是S,E,即稅收機(jī)關(guān)以S的概率查稅,而納稅人以E的概率逃稅。
污染博弈
貿(mào)易自由與壁壘
博弈論是一個(gè)強(qiáng)有力的分析工具。現(xiàn)在,它不僅在經(jīng)濟(jì)學(xué)領(lǐng)域、在軍事、政治、商業(yè)征戰(zhàn)、社會(huì)科學(xué)領(lǐng)域以及生物學(xué)等自然科學(xué)領(lǐng)域都有非常重大的影響,工程學(xué)中如控制論工程也少不了它。幫助大家形成博弈論的基本概念,實(shí)際上它是非常精深的?,F(xiàn)在與它緊密聯(lián)系的經(jīng)濟(jì)學(xué)分支是信息經(jīng)濟(jì)學(xué)。信號(hào)游戲、拍賣形式、激勵(lì)機(jī)制、委托人--代理人理論和公共財(cái)政學(xué)是博弈論和信息經(jīng)濟(jì)學(xué)研究的重要課題
對(duì)博弈論的兩種極端評(píng)價(jià)
從20世紀(jì)70年代末期,學(xué)者們逐漸形成一個(gè)共識(shí),當(dāng)一個(gè)人或群體與他或他們的博弈論對(duì)手都能以理性的方式做出決策行為的時(shí)候,那就是博弈論大顯身手的場合。
有人將博弈論比作Mendel的遺傳理論和Darwin的自然選擇對(duì)生物學(xué)的影響,或者Newton的天體力學(xué)對(duì)物理學(xué)的奠基作用。
真正的社會(huì)并不嚴(yán)格是博弈論的理想對(duì)象,無論是股票市場上的投機(jī)現(xiàn)象,還是受制于傳統(tǒng)文化的慣性影響下的體制選擇。如同混沌動(dòng)力系統(tǒng)理論帶給人們的初始興奮之后,博弈論并不具有有歷史上像物理學(xué)中理論的預(yù)測能力。
四.博弈論與運(yùn)籌學(xué)
運(yùn)籌學(xué)是近代應(yīng)用數(shù)學(xué)的一個(gè)分支,主要是將生產(chǎn)、管理等事件中出現(xiàn)的一些帶有普遍性的運(yùn)籌問題加以提煉,然后利用數(shù)學(xué)方法進(jìn)行解決。前者提供模型,后者提供理論和方法。
運(yùn)籌學(xué)本身也在不斷發(fā)展,現(xiàn)在已經(jīng)是一個(gè)包括好幾個(gè)分支的數(shù)學(xué)部門了。比如:數(shù)學(xué)規(guī)劃(又包含線性規(guī)劃;非線性規(guī)劃;整數(shù)規(guī)劃;組合規(guī)劃等)、圖論、網(wǎng)絡(luò)流、決策分析、排隊(duì)論、可靠性數(shù)學(xué)理論、庫存論、對(duì)策論、搜索論、模擬等等。
數(shù)學(xué)規(guī)劃
數(shù)學(xué)規(guī)劃的研究對(duì)象是計(jì)劃管理工作中有關(guān)安排和估值的問題,解決的主要問題是在給定條件下,按某一衡量指標(biāo)來尋找安排的最優(yōu)方案。它可以表示成求函數(shù)在滿足約束條件下的極大極小值問題。
排隊(duì)論
排隊(duì)論是運(yùn)籌學(xué)的又一個(gè)分支,它有叫做隨機(jī)服務(wù)系統(tǒng)理論。它的研究目的是要回答如何改進(jìn)服務(wù)機(jī)構(gòu)或組織被服務(wù)的對(duì)象,使得某種指標(biāo)達(dá)到最優(yōu)的問題。比如一個(gè)港口應(yīng)該有多少個(gè)碼頭,一個(gè)工廠應(yīng)該有多少維修人員等
搜索論
搜索論是由于第二次世界大戰(zhàn)中戰(zhàn)爭的需要而出現(xiàn)的運(yùn)籌學(xué)分支。主要研究在資源和探測手段受到限制的情況下,如何設(shè)計(jì)尋找某種目標(biāo)的最優(yōu)方案,并加以實(shí)施的理論和方法。在第二次世界大戰(zhàn)中,同盟國的空軍和海軍在研究如何針對(duì)軸心國的潛艇活動(dòng)、艦隊(duì)運(yùn)輸和兵力部署等進(jìn)行甄別的過程中產(chǎn)生的。搜索論在實(shí)際應(yīng)用中也取得了不少成效,例如二十世紀(jì)六十年代,美國尋找在大西洋失蹤的核潛艇“打谷者號(hào)”和“蝎子號(hào)”,以及在地中海尋找丟失的氫彈,都是依據(jù)搜索論獲得成功的。
五、完全信息動(dòng)態(tài)博弈
納什均衡的問題:多均衡、單選擇性(靜態(tài)性),不可置信威脅的存在性(市場進(jìn)入博弈)
澤爾騰剔除了不可置信威脅戰(zhàn)略,減少了納什均衡的個(gè)數(shù)
擴(kuò)展型表述的要素:參與人、參與人行動(dòng)的時(shí)點(diǎn)、行動(dòng)集合、信息,支付函數(shù)
子博弈精煉納什均衡
當(dāng)參與人的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成納什均衡。每一個(gè)子博弈都是最優(yōu)的。
城市姑娘愛上農(nóng)村小伙子導(dǎo)致姑娘父親的反應(yīng)。
承諾行動(dòng)(commitment),當(dāng)事人使自己威脅戰(zhàn)略變得可信的行為。
例子(要挾訴訟,曾諾行動(dòng)與精煉均衡的關(guān)系)
成功可能性非常小,目的是希望和解得到補(bǔ)償。
原告指控的目的本身意味著TX<P,原告將選擇放棄。子博弈精煉納什均衡是:原告選擇(不指控,要求,放棄),被告選擇(拒絕);均衡結(jié)果為原告不指控。
承諾行為,如果原告將P提前支付,TX-C-P>-C-P,只要?jiǎng)僭V的可能大于0,原告將起訴。如果S<TX+D,被告將接受原告的賠償請(qǐng)求。S的范圍(TX,TX+D),賠償結(jié)果為TX+D/2
如果TX+D/2>C+P,原告提起訴訟;即使TX<C+P,由于D值大, TX+D/2>C+P仍有可能。( TX+D/2-C-P,-TX-D/2)案件私了。
不完全信息靜態(tài)博弈
不了解對(duì)方的偏好、戰(zhàn)略空間及各種戰(zhàn)略組合下的利潤水平。
市場進(jìn)入博弈
海薩尼轉(zhuǎn)換
引入虛擬參與人“自然”
在所有后果間是無差異的。
自然的選擇提供了被選擇的參與人真實(shí)類型的概率分布。
分布函數(shù)是共同知識(shí)。
“不完全信息”轉(zhuǎn)換為“完全但不完美信息”
貝葉斯納什均衡Bayesian equilibrium
給定自己的類型和對(duì)方類型的概率分布的情況下,每個(gè)參與者的期望效用達(dá)到了最大化,沒有人有積極性選擇其他戰(zhàn)略的類型戰(zhàn)略依存組合。
期望利潤=40x+(-10)(1-x)
不完全信息動(dòng)態(tài)博弈 -----精煉貝葉斯納什均衡
壟斷限價(jià)模型(低成本價(jià)格與高成本價(jià)格透露的信息)
信號(hào)傳遞模型
成本的信息含量
求愛博弈
如果男人是柳下惠,女人穿少的時(shí)候他會(huì)看的概率是20%;如果男人是登徒子,女人穿少的時(shí)候他會(huì)看的概率是100%。
女人根據(jù)現(xiàn)有的信息判斷男人是柳下惠的概率為70%,因此女人估計(jì)自己穿少的時(shí)候,男人看的概率為:0.7*0.2+0.3*1=0.44
這是女人給定男人所屬類型的先驗(yàn)概率下,男人可能采取看的概率。
續(xù)
當(dāng)男人的確看了的時(shí)候,使用貝葉斯法則,根據(jù)男人看的這一行動(dòng),女人認(rèn)為男人是柳下惠的概率變?yōu)椋?
0.7*0.2/0.44=0.32
根據(jù)這一新的概念,女人估計(jì)自己穿少的時(shí)候男人會(huì)刊的概率為:
0.32*0.2+0.68*1=0.744
如果女人將這種行為再重復(fù)一次,男人又看了,則女人認(rèn)為男人是柳下惠的概率變?yōu)椋?
0.32*0.2/0.744=0.086
這樣女人通過男人一次次的看的行為,越來越認(rèn)為男人是登徒子而不是柳下惠。
這就是參與人行為傳遞信息的作用。
謝謝大家
楊云崗13701246658
willoowin@hotmail.com
博弈論與經(jīng)濟(jì)學(xué)思維(ppt)
[下載聲明]
1.本站的所有資料均為資料作者提供和網(wǎng)友推薦收集整理而來,僅供學(xué)習(xí)和研究交流使用。如有侵犯到您版權(quán)的,請(qǐng)來電指出,本站將立即改正。電話:010-82593357。
2、訪問管理資源網(wǎng)的用戶必須明白,本站對(duì)提供下載的學(xué)習(xí)資料等不擁有任何權(quán)利,版權(quán)歸該下載資源的合法擁有者所有。
3、本站保證站內(nèi)提供的所有可下載資源都是按“原樣”提供,本站未做過任何改動(dòng);但本網(wǎng)站不保證本站提供的下載資源的準(zhǔn)確性、安全性和完整性;同時(shí)本網(wǎng)站也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的損失或傷害。
4、未經(jīng)本網(wǎng)站的明確許可,任何人不得大量鏈接本站下載資源;不得復(fù)制或仿造本網(wǎng)站。本網(wǎng)站對(duì)其自行開發(fā)的或和他人共同開發(fā)的所有內(nèi)容、技術(shù)手段和服務(wù)擁有全部知識(shí)產(chǎn)權(quán),任何人不得侵害或破壞,也不得擅自使用。
我要上傳資料,請(qǐng)點(diǎn)我!
管理工具分類
ISO認(rèn)證課程講義管理表格合同大全法規(guī)條例營銷資料方案報(bào)告說明標(biāo)準(zhǔn)管理戰(zhàn)略商業(yè)計(jì)劃書市場分析戰(zhàn)略經(jīng)營策劃方案培訓(xùn)講義企業(yè)上市采購物流電子商務(wù)質(zhì)量管理企業(yè)名錄生產(chǎn)管理金融知識(shí)電子書客戶管理企業(yè)文化報(bào)告論文項(xiàng)目管理財(cái)務(wù)資料固定資產(chǎn)人力資源管理制度工作分析績效考核資料面試招聘人才測評(píng)崗位管理職業(yè)規(guī)劃KPI績效指標(biāo)勞資關(guān)系薪酬激勵(lì)人力資源案例人事表格考勤管理人事制度薪資表格薪資制度招聘面試表格崗位分析員工管理薪酬管理績效管理入職指引薪酬設(shè)計(jì)績效管理績效管理培訓(xùn)績效管理方案平衡計(jì)分卡績效評(píng)估績效考核表格人力資源規(guī)劃安全管理制度經(jīng)營管理制度組織機(jī)構(gòu)管理辦公總務(wù)管理財(cái)務(wù)管理制度質(zhì)量管理制度會(huì)計(jì)管理制度代理連鎖制度銷售管理制度倉庫管理制度CI管理制度廣告策劃制度工程管理制度采購管理制度生產(chǎn)管理制度進(jìn)出口制度考勤管理制度人事管理制度員工福利制度咨詢?cè)\斷制度信息管理制度員工培訓(xùn)制度辦公室制度人力資源管理企業(yè)培訓(xùn)績效考核其它
精品推薦
- 1暗促-酒店玫瑰靜悄悄地開 369
- 2終端陳列十五大原則 381
- 3專業(yè)廣告運(yùn)作模式 342
- 4****主營業(yè)務(wù)發(fā)展戰(zhàn)略設(shè)計(jì) 375
- 5中小企業(yè)物流發(fā)展的對(duì)策 394
- 6主顧開拓 482
- 7主動(dòng)推進(jìn)的客戶服務(wù) 342
- 8專業(yè)媒體策劃與購買 372
- 9中遠(yuǎn)電視廣告CF 417
下載排行
- 1社會(huì)保障基礎(chǔ)知識(shí)(ppt) 16695
- 2安全生產(chǎn)事故案例分析(ppt 16695
- 3行政專員崗位職責(zé) 16695
- 4品管部崗位職責(zé)與任職要求 16695
- 5員工守則 16695
- 6軟件驗(yàn)收?qǐng)?bào)告 16695
- 7問卷調(diào)查表(范例) 16695
- 8工資發(fā)放明細(xì)表 16695
- 9文件簽收單 16695