方子振学弈范文第1篇
澎湖9月26日举行了台湾有史以来第一起博弈公民投票,其也成为全台第―个办公投的县市。
这次博弈公投的题目为“澎湖要不要设置国际观光度假区附设观光”,选票上有“同意”与“不同意”两个选项。
依据修订后的《离岛建设条例》,此次公投没有“最低投票率门槛”的限制,正反任何一方只要多一票,就算赢。值得注意的是,如果此次公投没有过关,三年之内澎湖都不能再有相同的提案。
显然,澎湖人陷入了一场左右为难的挣扎。
一边是开放博弈可能带来的巨大商机,另一边是各种犯罪行为也将如影随形,同意还是不同意,这是―个哈姆雷特式的问题。
这一天,澎湖人使用手中的投票权,选择了朴实与理想。澎湖人宁愿要自己的家乡是片净土,而不是让其变成“赌城”。
20年来,澎湖如同一个被遗忘的角落。两岸实现大三通后,在台湾本岛和金门的夹缝下,澎湖更显边缘化,开放博弈被认为是一次可能的翻身机会,更是其迈向国际化的关键时刻。
不可否认,博弈公投遭否决后,澎湖未来的振兴之路将更为艰难。
做半年休半年产业
澎湖群岛位于分隔两岸的台湾海峡之间,面积约126平方公里,其中南北长60余公里,东西宽40多公里,由90多座岛屿组成。
澎湖群岛旧称平湖、澎海、渔翁岛等,后来因其内海水静如湖、外海澎湃汹涌而得名“澎湖”。
澎湖是台湾本岛以外三个外岛县之一,以美丽的海岛风光闻名,旅游观光和捕鱼是其两大主业。
由于每年都受到长达半年的东北季风的影响,每年夏季旅游高峰期间有几十万游客来澎湖观光度假,其他季节则基本上没有游客。
但是,以旅游观光和捕鱼为主的澎湖由于土地贫瘠,多年来工商业一直发展滞后,人口流失相当严重。截止到2006年底,澎湖的户籍人口为9万1千700多人,但常年居住人口只有4万多人。很多年轻人到外地求学、打工、谋生。
为了改变这种现状,过去20年来,澎湖地方政府和部分地方人士一直酝酿并呼吁在澎湖开放博弈产业,以带动当地经济与观光产业的发展。
澎湖县长王乾发说,澎湖地理位置得天独厚,自然景观无与伦比,在没有相关法律禁止本国国民进入的情况下,澎湖独特的离岛地理条件,能防堵相关机制的失缺,这一优势远远胜过其他地方。
台湾地区领导人也指出,有这种东西(),会帮助澎湖在风季冬天室内的活动,“增加它的趣味,增加它的竞争力,本岛没有这个问题,离岛才有。”
重申博弈条款,“第一个适用对象一定就是澎湖,不会是本岛其他县市。”
澎湖人投下反对票
在公投逼近的日子里,澎湖马公市街头除了零星的游客,一眼望去尽是满山满谷的旗帜,赞成、反对的说帖和标语,加上街头巷尾的嘈杂声,让过去夏季旺季一结束就准备“收摊半年”的澎湖,呈现出截然不同的风景。
一般人会认为,澎湖多是渴望翻身的捕鱼人,其实在这里定居的,为数不少是有退休俸的公务人员以及追求安逸的老人,对于他们来说,打着“改变”旗号的博弈,就成了非必要的选项。
公投前,经几波炒作,博弈派似已胜券在握。孰料,在社运、教育及宗教等反赌团体鼓励下,不少离乡游子纷纷返乡投票,对澎湖命运作了关键性的抉择。
澎湖设置博弈专区,带给澎湖人最大的美梦是能“以赌兴澎”,让向来靠天吃饭,做半年休半年的澎湖产业,能在经济弱势中翻转。
尽管台湾声称其业的定位是以发展“休闲观光”为主,但是由于两岸大三通以及大陆居民赴台旅游的开放,毫无疑问将会吸引澳门的内地客源与香港客源。
实际上,台湾构想在澎湖兴建仅次于澳门与新加坡的亚洲第三大,利用澎湖拥有的沙滩、潜水海域以及靠近中国大陆的地理位置,争夺澳门及新加坡的赌客。但现实的问题是,澎湖地处离岛,交通是个难题,每年冬天11月至1月风浪极大,飞航危险性高,机场要关闭,飞机要暂停降落。
根据澎湖县政府的估计,若每年能引进500万人次的游客,并以15%的税率计算,一年税收可达22.5亿新台币。
澎湖县政府允诺,等到博弈专区运作成熟后,65岁以上老人和幼儿每年可发放2万新台币补助金,高中职以下学生免学杂费。
然而,这些许诺并未感动大多数民众。对于“立法院”与澎湖县政府执意推动的博弈公投,澎湖人民显然还是没有领情。
争吵16年公投上路
开放离岛博弈,台湾岛内几乎不分蓝绿,有赞成,也有反对。
李登辉执政时期,光是中常会来来回回都吵翻天,政府时期,连吕秀莲兴趣都很高,还曾亲自出境考察;先后担任“行政院长”的谢长廷、也没有抗过党内的压力,开放博弈无疾而终。
“立法院”则是各方力量游说的另一个重要舞台,澎湖从1993年就争取设置观光、推动博弈条例,财团与地方民意代表除向当时的台湾省政府游说,还请出当时的“立法院长”刘松藩出席公听会,探讨澎湖设置观光的可行性。
博弈条款合法化因具高度争议,相关修正草案在每个“立法院”会期最后都被打回票,扁政府时期还发生台湾本岛如嘉义县等绿营执政的县市。也争取设置特区的情形。
认为澎湖博弈条款,对生态冲击很大,社会成本也很大,经济效益无法平衡成本。
“立法院”党团内部也有不同意见,但因为这是2008年台湾大选的竞选政见,最后才决定“一致投票支持”。
吵了16年,历经三任台湾最高领导人。今年1月12日,《离岛建设条例》终于在台湾“立法院”完成三读,赋予离岛博弈除罪化的法源,规定只要征得二分之一以上的离岛居民同意,即可在离岛合法设置。在特许地点从事博弈者,不适用刑法罪的规定。
该条例规范的离岛为金门、马祖、澎湖,台东的绿岛、兰屿及屏东的小琉球。第一个可能设置观光的地方,就在离岛澎湖。
澎湖县政府于4月9日正式向“行政院”申请举行博弈公投,经过两个多月的意见征询,终获时任“行政院长”刘兆玄的同意。
在收到“行政院”同意举办博弈公投函后,澎湖立即通知原始提案人和县选委会,开始进入公投连署作业阶段,最终有了9月26日的博弈公投。
方子振学弈范文第2篇
关键词:人工智能;博弈树;六子棋;
中图分类号:TP181文献标识码:A文章编号:1009-3044(2009)25-7198-03
The Research and Implementation of Connect6 Intelligent Chess Game System
HUANG Ji-Ping, ZHANG Dong, MIAO Hua
(School of Computer Science and Engineering, Chongqing University of Technology, Chongqing 4000504, China)
Abstract: As a new game, Connect6 has held an important position in the field of Computer chess game intelligence. It's a big problem to the efficiency of Computer Game, because Connect6 puts two chessman in one step to ensure that the game is fair. So, based on the implementation of main components of Connect6 game: description of state, search engine and evaluation function, this paper makes a new conception: "road", which simplifies the evaluation functions and effectively improve game performance.
Key words: artificial intelligence; game tree; connect6; genetic algorithms
在人工智能领域始终将棋类的机器博弈作为常用的研究平台之一[1]。以棋类游戏为研究和验证平台,各种搜索算法、智能方法在计算机博弈中都可以得到广泛的应用。1997年,“深蓝”小组研究开发出“更深的蓝”,以3.5比2.5击败了国际级大师卡斯帕罗夫,成为人工智能发展的一个里程碑。至今为止,计算机博弈在五子棋、象棋、国际象棋甚至围棋上都取得了卓越的成就。
1 六子棋简介
六子棋(Connect6)是由台湾交通大学吴毅成教授所发明的一种新游戏,由五子棋改良而来,相比较而言,它具有规则简单、变化复杂、游戏公平三个很好的特性。在六子棋里,除了持黑的第一手下一子外,黑白双方轮流各下两子,最后连成六子者胜。由于各方每次下完一手后,盘面都比对方多一子,因此赛局可自然达成平衡的状态,使得公平性大为提升。而五子棋、象棋等,先手常常具有一些优势。同时由于一次两子,组合变化莫测,其复杂度已被评估为仅次于围棋和日本象棋,远高于五子棋,与象棋相当或略高。
六子棋计算机博弈可以分解为四个核心部分:状态表示、走法生成、搜索引擎、评估函数。其中状态表示和走法生成是所有棋类游戏的基础,而搜索引擎很评估函数是使六子棋具有“思考”能力的关键。
2 状态表示
要实现计算机模拟六子棋的博弈过程,就需要对之的博弈状态进行分解描述。本文将六子棋机器博弈进程分别表示为三种离散数据结构:棋局状态,棋子状态和棋形描述。由于六子棋源于五子棋,在棋局和棋子状态的描述上和五子棋及围棋类似,所以下文主要针对六子棋的棋形进行阐述。
2.1 棋形描述
棋形就是棋局的一种状态描述,是描述棋盘上不同棋子的分布状态。采用状态矩阵可以比较清楚地描述某个时刻,机器博弈进程中棋局状态和棋子状态的变化,如何有意识地控制这个变化发展方向,并使得朝有利于己方赢棋的方向发展,是机器博弈进程中,计算机需要解决的核心问题。
本文采用了其中15种棋形:连六(获胜)、长连(获胜)、活五、眠五、死五、活四、眠四、死四、活三、眠三、朦胧三、死三、活二、眠二、死二,并将这些棋形的描述放入决策支持系统的知识库,形成了计算机博弈决策系统推理的基础,下面对其中重要的改进解释如下:
① 六连,C6:在棋盘的纵向、横向或斜向的任意一条线上,形成的连续相连的6颗同色棋子。
② 活五,C5:在同一直线上的5颗同色棋子,符合“对方必须用两手棋才能”的条件。
③ 活四,C4:在同一直线上的4颗同色棋子,符合“对方必须用两手棋才能挡住”的条件。
④ 眠四,S4:在同一直线上的4颗同色棋子,符合“对方用一手棋就能挡住”的条件。
⑤ 死四,D4:在同一直线上的4颗同色棋子,它们已无法形成六连或长连。
⑥ 朦三,S3:在同一直线上的3颗同色棋子,符合“再下一手棋只能形成眠四,但如果再下两手棋的话就能形成活五”的条件。
2.2 “路”的思想
事实上,六子棋中每一种棋形都有很多的表现形式。同时如果有几种棋形交叉时判断起来就更加复杂。如何判断棋形就成为计算机系统难点,如果模板设置错误或棋形统计不完全,将严重的影响博弈系统的棋力。因此本文提出“路”的概念。所谓 “路”就是在棋盘上连续6个点能够连成一条直线,则称为1“路”。六子棋棋盘是19×19的棋盘,计算可得一共有924“路”。这样每条“路”上就只有6个点,这样就使得棋形的判断和统计非常简单了。例如,在某“路”里已经存在4颗棋子,此时就无需去判定它到底是活四、眠四,还是眠四棋形,从而极大减少了计算量。
当博弈开始并下棋子时,用两个哈稀表来分别存储棋盘上已下棋子和待搜索点的信息,对于有棋子的用哈稀表中的键值key,分别表示棋盘上棋子的坐标和棋子对象,这样特定的key就对应一个value值。对于待搜索点(Evealutepoint),将最外层的已下棋子的点(UsedPoint)向外扩展5个点,从而所得到未下棋子点的集合,并存放到一个哈希表中。这样的表示就可以比较方便地找到棋盘上面的棋子状态,实际上只要遍历哈稀表,而不是遍历整个棋盘,从而极大地节约时间。
3 搜索策略
在二人博弈问题中,为了从众多可供选择的行动方案中选出一个对自己最为有利的行动方案,需要对当前的情况以及将要发生的情况进行分析,通过搜索算法从中选出最优的着法。在博弈问题中,每个棋局可供选择的行动方案有很多。因此,将生成十分庞大的博弈树,如果试图通过直到终局的与或树搜索而得到最好的一步棋,这是不可能实现的。例如,30步的六子棋完整的博弈树,可以计算出大约有10140个节点,假设每个博弈树枝的长度为30,大约有335个判断分支点,那么从起点到终点大约有2335条路径,即使按照每条路径耗时1/10000秒,也大约需要耗时2335/214≌2321(秒) 2298(年)。显然,要遍历所有分枝、接点,目前的任何计算机都无法完成这个搜索任务。因此,必须寻求合适搜索算法,以完成该项搜索任务。下面将介绍一些这样的搜索算法。
3.1 极大极小值搜索算法
极小极大搜索法是最常使用的搜索方法,其基本思想是:
1) 设博弈的双方中一方为MAX,另一方为MIN。然后为其中的一方(例如MAX)寻找一个最优行动方案。
2) 为了找到当前的最优行动方案,需要对各个可能的方案所产生的后果进行比较,具体地说,就是要考虑每一方案实施后对方可能采取的所有行动,并计算可能的得分。
3) 为计算得分,需要根据问题的特性信息定义一个估价函数,用来估算当前博弈树端节点的得分。此时估算出来的得分称为静态估值。
4) 当端节点的估值计算出来后,再推算出父节点的得分,推算的方法是:对“或”节点,选其子节点中一个最大的得分作为父节点的得分,这是为了使自己在可供选择的方案中选一个对自己最有利的方案;对“与”节点,选其子节点中一个最小的得分作为父节点的得分,这是为了立足于最坏的情况。这样计算出的父节点的得分称为倒推值。
5) 如果一个行动方案能获得较大的倒推值,则它就是当前最好的行动方案。
在博弈问题中,面对庞大的博弈树,试图利用完整的博弈树来进行极小极大分析是困难的。可行的办法是只生成一定深度的博弈树,然后进行极小极大搜索,找出当前最好的行动方案。在此之后,再在已选定的分支上扩展一定深度,再选最好的行动方案。如此进行下去,直到取得胜败结果为止,至于每次生成博弈树的深度,当然是越大越好,但由于受到计算机存储空间的限制,只好根据实际情况而定。
3.2 Alpha―Beta算法
Alpha-Beta剪枝搜索是一种基于剪枝(Alpha-Beta cut-off)的深度优先搜索(depth-first search)。将走棋方定为MAX方,因为它选择着法时总是对其子节点的评估值取极大值,即选择对自己最为有利的着法;将应对方定为MIN方,因为它走棋时需要对其子节点的评估值取极小值,即选择对走棋方最为不利的、最有钳制作用的着法。
Alpha剪枝:在对博弈树采取深度优先的搜索策略时,从左路分枝的叶节点倒推得到某一层MAX节点的值,可表示到此为止得以“落实”的着法最佳值,记为Alpha。显然此Alpha值可作为MAX方着法指标的下界。在搜索此MAX节点的其它子节点,即探讨另一着法时,如果发现一个回合(2步棋)之后评估值变差,即孙节点评估值低于下界Alpha值,则便可以剪掉此枝(以该子节点为根的子树),即不再考虑此“软着”的延伸。此类剪枝称为Alpha剪枝。下图给出了搜索和剪枝过程,最后得到如粗箭头所示的最佳路径片断。
Beta剪枝:同理,由左路分枝的叶节点倒推得到某一层MIN节点的值,可表示到此为止对方着法的钳制值,记为Beta。显然此Beta值可作为MAX方可能实现着法指标的上界。在搜索该MIN节点的其它子节点,即探讨另外着法时,如果发现一个回合之后钳制局面减弱,即孙节点评估值高于上界Beta值,则便可以剪掉此枝,即不再考虑此“软着”的延伸。此类剪枝称为Beta剪枝。下图给出了搜索和剪枝过程,最后得到如粗箭头所示的最佳路径片断。
Alpha-Beta剪枝算法的效率与子节点扩展的先后顺序相关。为了得到最好的节点扩展顺序,许多搜索算法在着法(节点扩展的分枝)排序上给予特别的关注。比如在着法生成(节点扩展)时,先生成吃子着法,尤其先生成吃分值高的“大子”着法,因为由此产生着法更有可能是最佳的.围绕着法排序,已经出现许多优秀的搜索算法与举措。如:同形表法、吃子走法的SEE排序、杀手走法、未吃子走法的历史启发排序、类比法等。当然这些只适用于象棋类型的多种棋子的游戏。
Alpha-Beta剪枝算法伪代码描述如下:
int AlphaBeta(int depth, int alpha, int beta) {
if (depth == 0) {
return Evaluate(); }
GenerateLegalMoves(); //产生所有的可能走法
while (MovesLeft()) {
MakeNextMove();
val = -AlphaBeta(depth - 1, -beta, -alpha);
UnmakeMove();
if (val >= beta)
{return beta; }
if (val > alpha)
{ alpha = val; }}
return alpha; }
4 确定评估值
六子棋的棋形估值涉及的因素多,是一个非线性规划问题。例如,活三、活四、眠三、眠四等,通过统计方法、经验值来比较,尽管符合大多数棋类游戏的估值特点,但是将会产生新问题,由于棋形的变化多种多样,很多时候因为棋形统计不全而导致估值有错,进而输掉了比赛。对棋局局面判断、估值主要就是通过统计方法和搜索棋形来完成的,是预先给每种棋形设定一个经验值,经过统计得到如果在某个位置行棋落子后,棋局局面的估值将产生什么变化来决定的。因此,此时的估值与搜索是相互影响和相互促进的,好的估值能够促进有效的搜索剪枝,这样能大大减少需要搜索的点,节约搜索时间。而且,搜索时能够有好的搜索顺序,结合估值的准确性,能最大程度的减少搜索点,在有效的时间范围内,最后确定的要走的点就更加准确。但是,估值与搜索是非常难于协调配合的,实际效果并不如意。
针对六子棋机器博弈的特点,本文采用“路”和“迫着”思想,将19×19的棋盘划分为924“路”,根据“路”来估值,计算出棋盘的状态值。这样就只需要计算924“路”中的棋子颗数即可,根据棋子的颗数给出估值,从而使得估值范围大大缩小,就能明显地提高计算速度。新系统的估值不再进行棋形的判定,仅仅计算“路”中已有的同色棋子的颗数,然后找到“路”相对应的值。假设在某点走子后,计算棋盘局面的状态变化值,通过对比搜索出最优值所对应的行棋走子组合――“着法”。在本文博弈系统的估值中,需要注意两点:一是如果同一“路”中存在不同色的棋子,则该“路”就失去了利用价值或威胁,需要抛弃;二是在估值前,假设在某点走子时,某条“路”出现了6个同色的棋子,则胜败已分,系统将自动结束比赛。
5 结束语
本文介绍了实现六子棋智能博弈系统的几个核心部分:状态表示、搜索算法和估值函数。Alpha-Beta剪枝算法提升了系统搜索的效率,结合针对六子棋特点设计的估值函数,使机器具有较强的”思考”能力。而本文提出的“路”的思想又使得估值函数类型大大减少,进一步提高搜索效率,对提升六子棋的棋力具有较好的作用。
参考文献:
[1] 徐心和,王骄.中国象棋计算机博弈关键技术分析[J].小型微型计算机系统,2006,27(6):961-969.
[2] 王小春.PC游戏编程[M].重庆:重庆大学出版社, 2002:1-27.
[3] 蔡自兴,徐光.人工智能及其应用[M].北京:清华大学出版社,2005.
[4] 王永庆.人工智能原理与方法[M].西安:西安交通大学出版社, 2000.
[5] 瞿锡泉,白振兴,包建平.棋类博弈算法的改进[J].现代电子技术,2005(01):96-99.
[6] 张海峰,白振兴,张登福.五子棋中的博弈智能设计[J],现代电子技术,2004,27(7):25-27.
方子振学弈范文第3篇
【关键词】 人民币汇率 升值 博弈模型 进出口贸易
引言
随在人民币升值对于中美贸易的影响研究中,国内学者主要持两种观点,一是人民币升值的确对中国的出口起到负面影响[1],但是这于中美双方而言是互伤的行为[2]。美中的贸易逆差并不是由于人民币汇率政策的影响[3]。二是人民币升值虽然对中国有负面影响,但辩证地来看,对中国也是有积极影响作用的,例如可以促进中国的产业结构调整与升级[4]。对于人民币升值究竟采取渐进式还是一步到位式的争论中,近年来,大部分学者支持渐进式升值的路径[5]。
1. 假设人民币升值对中美贸易逆差不会有影响
彭红枫根据1985年至2009年月度数据的计量分析得出结论人民币汇率并非导致美中贸易逆差的真正原因。刘伟的研究同样表明:单纯的人民币汇率变动对中美之间的贸易差额影响不大。基于这一结论,本文假设人民币升值对美国并没有收益,再假设中国在博弈中有两种选择,即升值和不升值,而美国也有两种选择,即制裁和不制裁,中美同时做决策(即采用静态博弈模型)。当美国对中国实行制裁时,对中国商品收取惩罚性关税,中国利益将受损,而美国可获得短期利益收入。给出中美在双方不同决策下的收益值,则博弈的收益矩阵可表示为:
当美国不对中国采取制裁策略时,中国选择人民币币值稳定,则可获得外贸收益4个单位;一旦美国对中国实行制裁,中国的外贸出口出现困难,加上美国国债的贬值,中国将损失2个单位。根据人民币汇率对美国贸易逆差无影响的假设,美国只能获得制裁的短期收益。
根据划线法,可以求出该博弈的纯策略纳什均衡,(3,-1)。在这种情况下,无论美国的策略选择是什么,中国的最优选择都是不升值。同样,无论中国的策略选择为何,美国的最优选择都是制裁。
2. 假设人民币升值可减少美中贸易逆差
除了上述观点外,也有学者认为人民币升值确实使得中国对美出口面临困境,尤其是劳动密集型产业受创严重,美中贸易逆差也出现反转。以这一理论为基础,对上述模型进行调整,假设人民币升值可以给美国带来收益,则收益矩阵可表示为:
我们同样可以求出这种情况下的纯策略纳什均衡--(3,-2)。此时的均衡结果同第一种假设下的结果相同,中美两国的最优选择分别为不升值和制裁。
3. 假设中美间的人民币升值博弈是无限次的重复博弈
在这种情况下,中美贸易不再只注重短期利益,而着眼于长期。由于人民币的升值,中国出口的减少,使得美国人不得不购买本国更为昂贵的商品,从而导致美国人的可支配收入减少,影响消费,根据Y=C+I+G+NX,消费的减少同时使美国产出下降。因此,人民币升值对中美而言都是不利的。根据李嘉图的比较优势理论,贸易有利于贸易双方条件的改善。在上述理论及假设下,我们给出此时的收益矩阵:
在这一博弈模型中,存在唯一的均衡结果--(-3,-3)。虽然(4,4)相对于(-3,-3)而言是帕累托改进,但是由于两国各自的政治目的,不会实现。根据无限次重复模型[6],如果中国选择不让人民币升值,美国再第一阶段选择制裁,那么可获得收益5,但在以后各阶段中,中国升值,则美国的总收益为:
=5+δ(-3)+δ2δ2 (-3)+…
=5-3δ/(1-δ)(1)
其中,δ为贴现因子。
如果美国的选择是不制裁,那么双方的选择都不会再变。此时令无限次博弈的总收益现在值为V,则V=4+δV,即V=4/(1-δ)。(2)
因此,当(2)>(1)时,即δ>1/8时,稳定的汇率政策就是双方的最优选择。
结论及政策建议
对于美国政府而言,无论是出于转嫁责任还是经济发展的要求,迫使人民币升值是其必然选择,而中国在多方压力下,既要坚定稳定的汇率政策,同时应该抓住时机,积极调整产业结构,大力发展技术密集型产业,同时拉动内需,改变外贸依存度过高的现状。
参考文献:
[1] 孟舒,美国催促人民币升值背后的政治目的刍议,牡丹江大学学报[J],2011年2月第2期.
[2] 侯卜魁,关于人民币升值快慢的决策博弈,金融[J],2009年第1期.
[3] 刘伟,人民币升值与中美贸易失衡的关系探讨,经济问题[J],2010年第9期.
[4] 王勇,辩证对待美中贸易摩擦和施压人民币升值问题,中国经贸[J],2010年第4期.
[5] 徐挺,人民币的升值路径极其经济绩效分析,国际金融[J],2009年第2期.
方子振学弈范文第4篇
【关键词】 销售者 消费者 博弈
一、引言
在现实市场中,古典经济学亚当.斯密《国富论》(Adam Smith,Wealth of the Nation)其中一项主要理论“看不见的手”(Invisible Hand)主张自由市场其实是很难存在的,因为市场中的利益冲突使自由竞争难以实行。在实战之中信息理论和信息产业在当代的环境中被严重忽略。艾尔福雷德.马歇尔(Alfred Marshall)在其经济学原理(Principle of Economics)第4卷提出了四大生产要素:土地(land)、劳动力(labour)、资本(capital)、组织“企业家”(entrepreneur),后来有学者加入了政治稳定(political stability),仍未把“时间、空间、信息、产品”加入生产要素之中。例如:“囚徒困境”的双变量信息集(information set)所出现的完全信息、动态博弈。即是每个参与者在选择战略时不知道其他参与者的选择到了(或没有达到了)信息集中的哪一个节。正如在市场上的信息,大部份都是非对称信息(asymmetric information)。而供应和价格之间的均衡点或函数关系受信息、时空的影响十分大。信息经济学描述了在信息不对称的情况下,经济中当事人的行为及其后果,进而探讨相关的制度设计。由于信息不对称,信息优势方有讨便宜的机会,因此可以说,信息经济学是研究如何让人讲真话,如何让人守诺言的学问。现今配合“消费者行为”(consumer behaviour)的研究及“生活经济学”(economics of everyday life),促使市场上出现了“注意力经济学”(The Attention Economy)的研究,它似乎比信息经济学(专注于金融市场博弈)更具人性(human nature),并且使消费品市场离开“看不见的手更远”。“注意力经济”是探讨在商品丰富的情况,你面对琳琅满目的商品愈多,容许你琢磨比较的时间却愈来愈少,长此下去,你的注意力必定衰退,变得难以被吸引,所以如果此理论成立,则商战要成功,经济要成功,就要从吸引消费者的注意力着手。这就是“注意力经济”的主要思想。
本文会以“廉价鞋R2.2、名牌皮鞋(分为优质L’3.1及“非”优质R’0.0)、草鞋M,在市场上销售者(参与者1)和消费者(参与者2)之间的非完全信息动态博弈(其中一个“参与者2”不知道另外“参与者1”的收益函数),并且把上述的经济及市场理论加入弈博过程中。
二、廉价皮鞋R、名牌皮鞋L、草鞋M博弈
由于消费者的注意力集中在那一个品牌的产品时,会形成信念推断(believe)是自然(nature)并且最优反应是基于满足序贯理性要求。
由于销售者(参与者1)要使消费者(参与者2)的注意力集中在他的品牌,所以用大量广告吸引消费者(参与者2),因此形成一个完全但不是完美资信的动态博弈,见图1。
R战略是销售者(参与者1)以最低售价或最低利润使消费者(参与者2)处于R廉价鞋战略。但仍要投放广告,所以选择行动R的收益只有2,相等于消费者(参与者2)的收益2。2-2=0,参与者1未获优势,博弈结束。
但商人要以最大收益(revenue maximization)及机会成本(opportunity cost)信念推断求取更大收益而放弃较少收益的劣战略,所以不选R战略而继续博弈。
销售者(参与者1)以大量广告使消费者(参与者2)的“注意力”集中于L,形成精炼贝叶斯均衡(perfect Bayesian equilibrium)排除了选择的战略包含始于任何信息集的严格劣战略是不合理的,但仍无其他更优收益选择。就是在市场学上的品牌力量(branding power)或名牌效应。消费者往往选择价钱较高的名牌优质皮鞋,而不会选择低价而品牌形象较劣的鞋。
当L,L’战略是加大广告宣传,但售价及质量亦相应增高,所以销售者(参与者1)的收益增至3,而消费者(参与者2)的收益减低至1(设定是售价升一倍,其反比函数关系为战略R的收益2的一半,所以2×0.5=1)。
选战略R时参与者1及2之收益总和是2+2=4,而L,L’战略的纯战略贝叶斯均衡的参与者1及2之收益总和3+1=4,3-1=2。销售者明显占优于消费者。
L,R’战略是名牌劣质鞋,对销售者(参与者1)是损害声誉,所以收益是0;对消费者(参与者2)亦是无收益,所以亦是0,是严格劣战略。
M战略应该是市场学中的夕阳产品。例如:草鞋。销售者及消费者已尽力转往其他行业或其他产品,所以概率P?燮1/2,应认定到达这一节点的概率为0;P=0。
表1中有两个纯战略贝叶斯均衡:(L,L’,P=1)和R,R’, P?燮1/2),没有任何子博弈,因为原博弈就是子博弈精炼纳什均衡(subgame-perfect Nash equilibrium)。
M是信息集的严格劣战略时,表示销售者(参与者1)及消费者(参与者2)或发送者(sender)及接收者(receiver)选择另一战略都可以获得更高收益,所以按Chao和Kreps“直观标准”(intuitive criterion)(啤酒或热狗博弈)是均衡劣信号,所以直接定概率为零P=0。
三、理论验证
销售者(参与者1)、消费者(参与者2)对廉价鞋R战略、名牌皮鞋L战略及草鞋M战略之间的博弈出现需要广义的后博弈(continuation game)概念来代替子博弈的纳什均衡。因为参与者的战略要成为博弈的一个精炼贝叶斯均衡,它们不但必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯纳什均衡。在这里按豪尔绍尼(1967)理解,可以把一个非完全信息博弈描述为一个非完美信博弈自然告诉参与者i(参与者1),于是参与者j(参与者2)就不知道博弈进行的完整过程。自然(Nature是用概率分布)可以为非完全信息动态博弈中强化贝叶斯纳什均衡,同样可以强化完全非完美信息动态博弈。并且在这里的信号博弈(signaling game)销售者与消费者之间的广告宣传可以引用克雷普斯、米尔格龙(Milgrom)、罗伯茨以及威尔逊(1982)他们的分析:声誉(Reputation)在有限重复的囚徒困境中,阶段博弈有唯一纳什均衡的有限重复博弈,有唯一的子博弈精炼纳什均衡,即阶段博弈的纳什均衡重复几次。但是重复几次并不能解决销售者与消费者之间的“相互承继”对精炼贝叶斯均衡的再精炼,所以要用赵和克雷普斯(chao &Kerps,1987)的直观标准(Intuitive Criterion)来解廉价鞋、名价皮鞋及草鞋的博弈。
廉价鞋、名价皮鞋及草鞋博弈必须合乎下列要求:第一,推断(believe)在信息集中不同节点的一个概率分布达到单一决策节的概率为1。第二,参与者1先决定不采用R战略,然后“序贯理性”(sequentially rational)必须是按最优反应决定继续博弈(也就是销售者选择了L还是R)有一个推断。R2,2即是2-2=0销售者无明显占优;“随后的战略”选择L。这样的推断就表示达到两个节的概率p和1-p,-p,此信息集处于均衡路径之上(on the equilibrium path)。第三,在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与者的均衡战略给出。一个均衡在克雷普斯和威尔逊(1982)的均衡定义中不再只是由每个参与者的一个战略所构成,还包括了两个参与者在该他行动的每一信息集中的一个推断,但参与者的推断由其他参与者在博弈树更上端的行动所决定。在这里销售者选择L战略销售名牌优质皮鞋L’,3,1;另一路径(Path)L,R’0,0是名牌“非”优质皮鞋。第四,没有处于这一均衡路径之外的信息集,于是构成了一个精炼贝叶斯的均衡。因为M战略p
四、结论验证
这里“自然”(nature)首先行动:选择参与人的“类型”(Type)。被选择的参与人知道自己的真实类型(“销售者”参与者1),而其他参与人(“消费者”参与者2)并不清楚,但知道各种可能类型的概率分布。就是说概率分布函数是一种“共和知识”(common knowledge)。在“注意力经济”消费者(参与者2)面对资信泛滥、商品琳琅满目的例子中,“自然”首先选择销售者(参与者1)的类型——高成本还是低成本,名牌还是不知名商品;并且参与者1及2都知道高成本和低成本的可能性各为多少(廉价鞋、名牌鞋、草鞋是三种不同“类型”,并且三种成本高低的概率分布函数是一种“共同知识”)。在这个基础上“海萨尼转换”(the Harsanyi transformation)把“不完全信息博弈”转换成“完全但不完美信息”(complete but imperfect information)。“自然”作出了它的选择,但其他参与人并不知道它的具体选择是什么,但知道各种选择的概率分布。贝叶斯(Bayes)是一位概率统计学家;海萨尼用“共同知识”定义了“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。这样,注意力经济决策的目标是可以在给自已的类型和别人的类型依从战略的情况下,最大化自已的期望效用及期望价值(expected maximum efficiency and expected maximum value)。使销售者(参与者1)不选择R战略,而选择博弈继续以谋最优收益。
销售者(参与者1)选择L战略继续博弈就如美国载维.弗里德曼(David Friedman)在其生活经济学(Hidden Order: the economics of Everyday Life)以马歇尔(Alfred Marshall)定义的“经济改善”为衡量基础时一样,如果变化带来了净收益,这就意味着受益者(销售者,参与者1)不但可以给损失者(消费者,参与者2)提供补偿(名牌带来的感emotional function,即是以广告提升消费者的满足感),并能有所盈余,而如果收益者在补偿损失者的同时还有盈余,那一定就是净收益(“战略稳定”纳什均衡)。
在廉价鞋、皮鞋、草鞋博弈中,销售者(参与者1)创造名牌优质鞋都是为更大收益来投资在广告宣传,使消费者(参与者2)得到的补偿就是穿名牌优质鞋得到的满足感及经历,正如到过中国万里长城或美国拉斯韦加斯赌城的旅游经历一样,使用名牌的经验亦是一种令人向往的感受价值(emotional value),市场学者Stuart Crainer早已在1995年提出“广告创造品牌,而品牌成为消费者眼中的真理”(The brand can defeat reality which created by advertising)。从R战略到L或M战略的信息集是多个系统(类型、自然概率分布)一起逐步博弈至最优均衡。尽管把现实生活数字化或量化很像看似复杂,事实上却可用博弈论简化真实世界。英国画家贺隆(Patrick Heron)写道:“事物真正‘客观的’外表,是根本不存在的,或者说,它只是以其实无限复杂微细的数据形式存在。散漫的‘混沌’(Chaos)涌入视网膜里,刺激视觉,人类的眼睛借此学习,‘注入某些偏好的秩序’。”所以“注意力经济”和博弈论之间的拓展空间应该有很大的发展机会成为“注意力秩序博弈”,而超出信息博弈及Chao & Kreps的“直观标准”。
五、结语
新的突破需要新的方法、新的思维。今天,研究社会发展究竟是单线还是多线已不足以表示现实。应该不单是多线而且更是多层。所以博弈应该是多层,在某一层中的解,不一定是适合另一层的解。基层社会的最优纳什均衡是R战略(廉价鞋);富裕阶层的最优贝叶纳什均衡是L,L’战略(名牌优质皮鞋),而被定为严格劣单战略的M,R’战略(草鞋),仍是农民的子博弈精炼纳什均衡(subgame-perfect Nash equilibrium)。M,R’0.1。农民自己织草鞋(参与者2)的收益=1,销售者(参与者1)无销售机会,收益=0。
现今人类已经能够拥有“完备”信息,但却由于信息太多反而只达到博而不精的过程,而且“新”事物及“新”知识的周期愈来愈短。人类在管理信息,以便取得优势的能力亦愈来愈困难,所以忙忙碌碌的都市人,正面对生活节奏加快的烦恼及选择的烦恼。“注意力经济”基本上是市场学渗入“生活经济学”的论证,所以有很大机会突破非对称信息(asymmetric information)市场的研究,而从消费品市场拓展出新的岭域。多层次博弈应该用透视(perspective)解,而不单只是概率分布及“直观标准”。“近”(时间、空间)的事物较大和清楚,远的事物较小和模糊,不同高度(层次)有不同的景像,有如信息、价值及注意力的混沌共振。
【参考文献】
[1] 王则柯:解释的困惑[M].中信出版社,2003.
[2] 罗伯特.吉本斯:博弈论基础[M].中国经济出版社,1998.
[3] 亚当.斯密:国富论[M].上海三联书店,2008.
[4] David Friedman:费里德曼的生活经济学[M].中信出版社,2002.
[5] Peter M.Lee:Bayesian Statistics an introduction[M].ARNOLD,1997.
[6] 余鑫炎:品牌战略与决策[M].东北财经大学出版社,2001.
[7] 张维迎:博弈论与信息经济学[M].上海三联书店、上海人民出版社,1996.
[8] John Briggs and F. David Peat:乱中求序,混沌理论的永恒智慧[M].台湾先觉出版社,2000.
方子振学弈范文第5篇
奋斗是青春最美的底色
“亲,您订购的两只兔子下午就给您送过去。”的陈诚正在长宁镇马村村公所里熟练的使用手机,记录今日订货情况。“这两只兔子和上午订鸭子那户在同一个小区,一会儿我们一起送。”电话微信切换之间,记录下陈诚忙碌的模样。
2012年底,在外务工的陈诚决定回到长宁镇村上发展。刚回到马村任村主任助理那段日子,村民们都说,大学生回乡下来可惜了。“家人也不太支持我回到村上发展,但我觉得马村自然资源丰富,大有可为。”
2018年初,陈诚就带领马村在全县率先开通的电商平台“佛来e红商”,让村里的农产品实现了“线上”销售。
2020年初疫情期间,村民无法参与赶场,城市居民难得出门。“我从疫情中看到了电商发展的机遇。”陈诚立刻联系组长统计农户农产品囤积情况,另一边利用线上平台收集城市居民的日常需求。上门取货,组织售卖,安排配送、打造口碑…这位年轻的村党委书记带给了村落新颖的生产销售方式。佛来e红商搭起了农村和城市之间的桥梁,通过无接触式配送,让村里的农产品实现了“线上”销售,成为了解决农副产品滞销的“利器”。
“前段时间,在陕西考察的时候,提到农村电商大有可为。”忙碌一整天的陈诚说起佛来e红商一下子来了精神,她说总书记的一番话坚定了他们的发展信心,未来马村还要按照“水产为主,多品共生,电商结合,旅游养生”的发展思路,以“五千工程”为抓手大力实施乡村振兴,让马村田里养鱼,山上种果,园区酿酒,网上销售,三产结合,农旅促融。
陪伴是青春最美的誓言
“清明时节雨纷纷,路上行人欲断魂......”
在马村“在水一方”乡村振兴示范区水域边,传来了纯真稚嫩的吟诵声,这是长宁镇马村“童心港湾”的志愿者和童伴妈妈们。“童伴妈妈”欧传梅正在带领着全村20余名孩子们开展清明节主题活动。
清明节之外,每逢重要的节日,欧传梅还会带领村上的留守儿童开展节日活动,回顾历史、体验传统、了解文化,帮助他们在历史中、习俗中、文化中寻找中华民族的情感和精神力量。
今年年初,新冠肺炎疫情来势汹汹,许多在外务工的村民因为疫情影响无法回家。欧传梅主动放弃了自己的春节假期,第一时间走访本村留守儿童,进行家长返乡排查和疫情知识宣传。
“小欧,我们老年人不会用手机,娃儿要上网课啷个办嘛?”在走访的过程中,了解到部分留守儿童的困难之后,欧传梅主动提出到留守儿童家中为他们补课。 每天,欧传梅都会认真预习孩子们的课程,做好详细的笔记和注解。她常说,“我辛苦一点没关系,孩子们的学业不能落下。”
说起自己担当童伴妈妈的经历,欧传梅说,最令她最高兴的事是,一些孩子们原来因为家长不在身边,性格比较腼腆,对于陌生人有很强的戒备感。在欧传梅的陪伴下,他们变得逐渐开朗起来。“能看到这些孩子们性格的转变是我最高兴的事情”
奉献是青春最美的模样
“您好,请正确佩戴口罩。”
“当前村里实施封闭管理,每天只允许一人出村2小时,请您理解。”
“老爷爷,疫情防控关键时期,镇上不赶集。”
.......简单重复的话语,守在村组道路口的志愿者代奕文每天得说上几十次甚至几百次。
受到疫情影响,代弈文的学校久久不能开学。疫情发生以来,看着白衣天使、解放军战士勇赴“疫”线,她也总盼着自己能为疫情防控做点什么。被迫留守在家中的她在得知长宁镇紧缺志愿者后,她第一时间响应号召投入到基层一线的疫情防控工作中。
经过系统的岗前培训后,她终于“如愿以偿”地投身到了战“疫”中。一件蓝色志愿者马褂、一个口罩、一打宣传资料、一个喊话器,成为了她每天的标配。除了做好日常统计,还要不间断向过往群众宣传疫情防控知识。
“看似单调乏味,但却让我的春节很充实,很有意义。尽全力做,不后悔。”尽管随时回家时手脚发僵,但代奕文仍继续坚守岗位,毫无怨言。