以“博弈”或“变通”为话题写作文

文章 2019-07-15 16:20:52 1个回答   ()人看过

诸葛亮误用马谡,致使街亭失守。孔明在西城中,准备启程。等他安排停当,司马懿引大军15万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军在城中。众官听到这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将,旌旗竟皆藏匿,诸军各收城铺。打开城门,每一门用上二十军士,扮作百姓,洒扫街道。而孔明披鹤髦,戴纶巾,引二小童,携琴一张,于城上敌楼前,凭栏而坐,焚香操琴。马司懿来到城下,见到诸葛亮焚香操琴,笑容可掬。司马懿吓坏了,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:莫非诸葛亮无军,故作此态,父亲何故退兵?司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说:司马懿料吾平生谨慎,不曾弄险,见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之。我们兵只有二千五百,若弃城而去,必为之所擒。

我们可以用如下的博弈矩阵来表示这个博弈:

这个博弈中,“进攻”是司马懿的“占优策略”。该博弈有两个纳什均衡,即:(司马懿“进攻”,诸葛亮“守城”);(司马懿“进攻”,诸葛亮“弃城”)。然而,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮知道。他们对博弈结构的知识是不对称的:诸葛亮拥有比司马懿较多的知识。当然这种知识的不对称完全是诸葛亮“制造出来的”。

司马懿是如何推理的呢?司马懿的推理是“归纳的”。司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”在司马懿看来,诸葛亮一生都是谨慎的,既然诸葛亮一生没有冒险,此次也肯定不会冒险,诸葛亮有埋伏。司马懿在“攻城”和“撤退”之间作出“撤退”的选择。

在这里,司马懿归纳作出了一个错误的策略选择。尽管如此,我们不能说司马懿是不理性的。司马懿作出错误的策略选取,是由于不完全信息造成的。在孔明-司马懿的博弈中,孔明做出的空城假象,目的就是让司马懿感到“攻城”有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,“攻城”失败的可能性较大,而“撤退”的期望效用大于“攻城”的期望效用。即:司马懿认为,“攻城”的期望效用低于“撤退”的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。

我知道是囚徒困境

就是AB两个囚徒 被抓住后 关在两个不同囚室

如果两个都不招供 则每人只判三年 如果都招供 则每人判五年

如果一个招供 另一个不招供 则招供的判一年 不招供的判十年

最好的结果当然是两个人都不招供 但是由于信息不对称

对A来说如果B不招供 则他招供好一些 如果B招供 他也是招供好一些

则招供是他的占优策略 他会选择招供

同样分析B 也 会选择招供

最终结果是两人都招工 并为达到两人都不招供的最优选择

这就是囚徒困境

一般经济学书上都会讲

囚徒末路

“囚徒困境”是博弈论里最经典的例子之一。它的模型是这样的:

两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

顶一下 ()  踩一下 () 

 

本文标签:

[!--temp.ykpl--]


友情链接: