以“博弈”或“变通”为话题写作文

文章 2019-07-15 16:20:52 共1个回答 ()人看过

诸葛亮误用马谡，致使街亭失守。孔明在西城中，准备启程。等他安排停当，司马懿引大军15万蜂拥而来。当时孔明身边别无大将，只有一班文官，五千军士，已分一半先运粮草去了，只剩二千五百军在城中。众官听到这个消息，尽皆失色。孔明登城望之，果然尘土冲天，魏兵分两路杀来。孔明传令众将，旌旗竟皆藏匿，诸军各收城铺。打开城门，每一门用上二十军士，扮作百姓，洒扫街道。而孔明披鹤髦，戴纶巾，引二小童，携琴一张，于城上敌楼前，凭栏而坐，焚香操琴。马司懿来到城下，见到诸葛亮焚香操琴，笑容可掬。司马懿吓坏了，立即叫后军作前军，前军作后军，急速退去。司马懿之子司马昭问：莫非诸葛亮无军，故作此态，父亲何故退兵?司马懿说：“亮平生谨慎，不曾弄险，今大开城门，必有埋伏。我兵若进，中其计也。”孔明见魏军退去，抚掌而笑，众官无不骇然。诸葛亮说：司马懿料吾平生谨慎，不曾弄险，见如此模样，疑有伏兵，所以退去。吾非行险，盖因不得已而用之。我们兵只有二千五百，若弃城而去，必为之所擒。

我们可以用如下的博弈矩阵来表示这个博弈：

这个博弈中，“进攻”是司马懿的“占优策略”。该博弈有两个纳什均衡，即：(司马懿“进攻”，诸葛亮“守城”);(司马懿“进攻”，诸葛亮“弃城”)。然而，司马懿不知道自己和对方在不同行动策略下的支付，而诸葛亮知道。他们对博弈结构的知识是不对称的：诸葛亮拥有比司马懿较多的知识。当然这种知识的不对称完全是诸葛亮“制造出来的”。

司马懿是如何推理的呢?司马懿的推理是“归纳的”。司马懿说：“亮平生谨慎，不曾弄险。今大开城门，必有埋伏。我兵若进，中其计也。”在司马懿看来，诸葛亮一生都是谨慎的，既然诸葛亮一生没有冒险，此次也肯定不会冒险，诸葛亮有埋伏。司马懿在“攻城”和“撤退”之间作出“撤退”的选择。

在这里，司马懿归纳作出了一个错误的策略选择。尽管如此，我们不能说司马懿是不理性的。司马懿作出错误的策略选取，是由于不完全信息造成的。在孔明-司马懿的博弈中，孔明做出的空城假象，目的就是让司马懿感到“攻城”有较大的失败的可能。如果我们用概率论的术语来说，诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时，在司马懿看来，“攻城”失败的可能性较大，而“撤退”的期望效用大于“攻城”的期望效用。即：司马懿认为，“攻城”的期望效用低于“撤退”的效用。诸葛亮惟有通过这个办法，才能让司马懿退兵。

我知道是囚徒困境

就是AB两个囚徒被抓住后关在两个不同囚室

如果两个都不招供则每人只判三年如果都招供则每人判五年

如果一个招供另一个不招供则招供的判一年不招供的判十年

最好的结果当然是两个人都不招供但是由于信息不对称

对A来说如果B不招供则他招供好一些如果B招供他也是招供好一些

则招供是他的占优策略他会选择招供

同样分析B 也会选择招供

最终结果是两人都招工并为达到两人都不招供的最优选择

这就是囚徒困境

一般经济学书上都会讲

囚徒末路

“囚徒困境”是博弈论里最经典的例子之一。它的模型是这样的：

两个嫌疑犯(A和B)作案后被警察抓住，隔离审讯;警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判8年;如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里，博弈的参加者就是两个嫌疑犯A和B，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白，是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为，假定A选择坦白的话，B最好是选择坦白，因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话，B最好还是选择坦白，因为B坦白判不被判刑而抵赖确要被判刑1年。即是说，不管A坦白或抵赖，B的最佳选择都是坦白。反过来，同样地，不管B是坦白还是抵赖，A的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑8年。在(坦白、坦白)这个组合中，A和B都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖，各判刑1年，显然比都选择坦白各判刑8年好得多。当然，A和B可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。

() ()

本文标签：

[!--temp.ykpl--]

上一页：《我不是最弱小的》阅读练习及答案

下一页：感动你我的瞬间作文