0%

赌博与游戏

事实上这篇专栏我老早就想写了,可惜之前一直在B站更新,明目张胆的聊博彩行业当然是没法聊的,现在在自家的博客网站上那自然是想写什么就写什么,芜湖。

我与赌博

总的来说,我与赌博还挺有渊源,不过是一些很奇怪的渊源。

我爹自述他最开始入社会有两个奇怪工作,一个是催债,一个赌博,后者主要是在茶馆打川麻,不是正式的场子,可以理解为比较小的黑场,所以什么通牌换牌熟得一批,像是我自己知道的几种换牌:第一种是自己多带两张牌,相当于十二张牌选十张牌出来听牌胡牌;第二种是换自己面前的牌山上的一张,具体来说是自己手里藏一张用不上的牌,在下一次摸牌的时候把这张牌与牌山上层的一张做调换;第三种也是换牌,不过是在最开始阶段,在最开始配牌的时候一次性拿六张,在整理牌的时候找两张不要的,在借着推牌的时机把这两张放在自己或者下家面前的牌山的末尾。第四种在川麻里很少用,基本上是在日麻中,是当初看B站视频看到的,叫做元禄码牌法,就是洗牌的时候以每四张一同色的顺序堆好自己面前的牌,然后通过手法确定自己摸的一定是这四张里面自己固定花色的那一张,因此吃碰破开牌序不影响这个手法。

不过后来因为碰到我妈了,发现不得不找个正经工作,所以才去上的班,不过上班的行业也挺乐—摩托车行业,重庆的业内人那个时代基本上都是自称“摩帮”,从这个称呼一看就知道也是承接了不少江湖气息,不过那就是后话了,唯一值得一提的是据我爹说,按他自己的说法,当时半年的工资不如他当年打牌一个月的收入,难蚌。

抛开我爹,我表哥的赌博经历就更加丰富了,他当初从初中开始沉迷彩票,记忆最深的还是说他当初高中的时候中了好几千块,这可是10年左右的几千,属实是他赌博生涯中难得的一场大胜(乐)。之后的故事倒是有些俗套了,普普通通的和老师起冲突,普普通通的上了个二本,普普通通的从体彩开始接触赌博,普普通通的开始各种地方借贷,普普通通的还不上资金链爆炸,普普通通的让他家里卖了套房子,具体数额不清楚,不过水下百来万还是有的。至于现在,十万年见不了一次,说是在外地工作,是不是被噶了腰子就不是我研究的方向了。

还有一些奇怪的联系,像是我某位老师的之前的学生也去数学系了,现在在国外是做职业德扑,也挺难蚌的。

至于我自己,虽然我有研究过一些赌博项目,像是21点,麻将,德扑等等,但是基本上都是从运筹学,行为经济学等角度来进行研究,并且不和任何陌生人打现金桌。至于原因,也正是本文的主要内容了。

数学

如果把钱从赌博这个行为中拿开,那么绝大多数赌博就是一个标准的博弈过程,因此,放大格局来说,研究赌博的许多人工智能算法,能够迁移到研究高复杂度高随机性的博弈过程,而这些博弈过程具有很强的现实意义。

而对于一个博弈过程,最重要的莫过于两点,期望与纳什均衡解了。

先来说说纳什均衡解,纳什均衡解是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。(不是写论文所以可以随便复制粘贴的感觉真爽啊)

因此我们常说,GTO策略(Game Theoretical Optimum,即博弈论理论最优策略,泛指纳什均衡对应的策略)是最强之盾。

最简单的例子就是石头剪刀布,这个博弈过程的纳什均衡解就是以1/3的概率分布出石头,剪刀或布。

那么我们就以这个例子来展示“最强的盾”的具体含义是什么。

当我们以1/3的概率分布出石头,剪刀或布时,我们断言,我们在这个博弈过程中输的概率总是小于等于1/3。

一个简单的证明是设对手出石头的概率为p,出剪刀的概率为q,出布的概率为1-p-q。那么我们输的概率为(1/3)*(p+q+1-p-q)=1/3

那么与之相对的,剥削策略就被称为最强之矛。注意到在上述情况下,无论对手以怎样的策略,我们以GTO策略获胜的概率总是1/3,但是如果对手只出布,那么我们完全可以只出剪刀,这样我们获胜的概率就是100%。此时我们称只出剪刀这个策略是针对只出布的这个策略的最佳剥削策略。

聊明白了策略,再来说说期望,一把赌博有两个大类,一类是赌场做庄,玩家做闲家和庄家对赌,一个难以扳倒的事实,这类赌博都是负收益博弈过程,庄家的收益总为正。换算到支出与收益相等的情况,即使在闲家完美执行纳什均衡解对应的GTO策略的情况下,根据赌博项目的不同,庄家的胜率大概在51%-57%。另一类是赌场固定局数收费,俗称抽水或者台费,因此此时玩家与玩家之间对赌,此时如果玩家之间都采取GTO策略,则玩家之间不存在输赢,而玩家需要向赌场支付抽水,因此在这种情况下玩家的期望依旧是负。

一部分人理解三门问题都相当困难,难以用数学去思考现实问题,属于是懵懂的活着,被带进赌博的坑里就是自然的了。

一部分人对赌博的认知往往就止步上述的数学讨论,他们常常说“久赌必输”,或者说“赌博赢是过程,输是结果”,一般不参与赌博,这个结论当然对,不过这还远不是赌博世界的全貌。

前景理论

注意到我们在以上的讨论中,做了这样一个假设:“玩家完美的执行GTO策略”,但是令人遗憾的事实是:玩家并不能完美的执行GTO策略,这是因为GTO策略往往要求玩家执行一个混合策略,即需要玩家在某个环节以不同的概率执行不同行动,例如石头剪刀布中就需要玩家以1/3的概率分布出石头,剪刀或布,或者德扑的某个环节下,需要玩家以80%的概率加注20%平跟,而行为经济学中的前景理论指出,即使玩家知道了GTO策略的一切,玩家也无法以正确的概率执行,我之前设计过一个实验,需要参与者以80%的概率选择A,以20%的概率选择B,而最终汇总的一千余份回答中,只有73%的A被选出,而这7%的差距就是人和GTO的偏差,而根据我们刚刚的讨论,任何偏离GTO策略的策略,都存在一个与之对应的策略,使其损失大于GTO策略,这7%的距离,就是人的局限性导致的亏损。

一些职业赌徒也发现了这样的问题,因为赌桌上是禁止使用手机,所以他们想出了一些获得随机数的方式,例如数手里的筹码的枚数的奇偶性来获得一个50%-50%的随机数,或者是此时所发的牌的牌背颜色(因为一场赌博往往涉及多副牌)来制造随机数。

连职业赌徒都不相信自己的纪律性,更何况普通人呢。

效用函数

效用函数在很多领域都有各自的定义,这里我们主要从运筹学的角度来阐释效用函数在赌博中起到的作用。效用函数表示现实中的钱与心理价格之间的对应关系。

这个定义似乎既不具体又不严格,因此我们还是举个简单的例子来辅助理解:此时有这样一个赌博项目,投骰子,参数费用60k,如果投出6则获得120k,如果投出1,2,3,4或5则无收益。一个显然的事实是,这个赌博项目的收益期望是负的30k,换句话说,参加一次这样的赌博的收益等于送给路人30k。一个大脑发育正常的人当然不会参加这样的赌博,你也许会这样想,但是我们考虑这样一个场景,有一个身患重病的人,只有60k的资产,但是由于救命的手术费用为100k,且这个人没有其余获得钱的途径,那么在此时,这个人对于任意小于100k的钱的效用都是0,这个人会理所当然进行这个有着明显负期望的赌博项目。

这个例子当然很极端,但是一个事实就是,人很难拥有线性的效用函数,大家总会存在风险偏好,在不同的金额下,或是厌恶,或是喜好。我在油管经常看一些职业德州扑克的现金桌复盘VLOG,经常听到的一句话就是:“这个价格太好了”,然后在复盘的时候这些职业玩家往往也认为自己的决策出现了错误,这就是效用函数影响了人的判断。另一个更生活化的例子就是:大家往往不是缺一点钱,而是缺一大笔钱,因此一些人忽视着一些负收益做着以小博大的美梦,在赌场小赚之后并不会停手,而是会换到更大尺度的桌子上进行更高额的赌博。

而赌场并不是人,他只是一个同时和海量的人对赌的黑盒机器,他自然保持着完美而冷静的线性效用,无情的使用着名为效用函数的镰刀收割着赌徒。

阈值

阈值是效用函数的一个衍生,这里指代赌博的成瘾性,事实上赌博的成瘾性非常容易理解,当把普通人丢在一个超高额度的现金流中,只有极少的人能够抑制住由生理激素释放带来的影响,一般来说和熟人打牌常常是固定额度,但是线上线下赌场有太多诱惑把人带上远超经济能力的桌子了,可能只是德扑的一次cooler,或者百家乐的几次连胜,就足够把人拉进本不该进入的圣坛了。

于是阈值开始提高,我自己就是很典型的例子,我自己一个学生,和熟人打川麻的接受上限5元四番封顶,但是事实上由于过节差人等等原因,我经常会呆这种桌子,而和我发小打牌的时候,他们只接受1元三番封顶,因此我在这种量级的赌局中很难全神贯注的思考策略,开始对数字脱敏,感觉低于一定额度的数字流动已经游离在了我的专注之外。

那么对于更高额度的情况,可能只是一次偶尔的50-100大小盲的德扑,一晚上的盈利可能就有10k,那如何让他去接受自己辛苦劳累上班一天只有300的工资呢?要不我就以这个为生吧,这赢钱也太简单了?止不住的这么想,直到从娱乐彻底的倒向成瘾。甚至到了债台高筑的地步,思考的依旧是如何从赌博中还钱,而不是别的方式。这就是阈值提高与路径依赖对人的思考的摧毁。

轰鸣

这个算是我自己的例子,虽然是游戏抽卡,不过在19年算是某种意义上的赌博也没差,当时是方舟的夏活,见色起意,想去抽一个黑,本想着歪两手总该出了吧,但是直到我歪了5次之后,我才停下来,这不是因为我意识到不对了,只是我单纯的把钱包刷没了。当时的烦杂感记得不是很清楚了,但是我记得很清楚的是一种轰鸣感。应该是从第三次歪之后开始的,我感觉大脑里面有很大的轰鸣声,很难让我去构建起理性的思考,像是被植入程序了一样,只能重复性的执行充钱抽卡的操作。很恐怖的体验。

就我现在的理解来说,当一些超出承受能力的损失发生时,人会首先否认事实,丧失基本的判断事实的能力,然后是错误性补救,人会依照本能的做出一些看起来像是补救措施的行为,哪怕事实上这些行为是更多的损失,这个时候的人接受了现实,但是丧失了思考正确决策的能力,再然后后是事态进一步恶化后,人理解了现状,但是放弃了抵抗,直到破坏一切,直到不能再有东西能够被破坏为止。

这就是藏在人基因中的缺陷,一种难以抗拒的动物性。

PRO

因此我们来认真的讨论一下,要成为一个职业赌徒,以赌博为工作,需要哪些能力:

1.数学上的,通晓一个赌博项目的GTO策略,必要的情况有能力研究人工智能算法来构造博弈决策。
2.心理上的,能够训练出自己做出固定概率的能力,接受现金流大范围波动的能力。
3.经济上的,做好财务管理和资产管理。

私以为,能有上述能力的,去金融行业可能赚得多一点,有能力研究ai的去互联网企业赚得也多一点,感觉去赌博算是屈才了,不过去应聘赌场也行(乐)。

随机

只聊赌博当然就太浅了,不过要是再加上游戏策划的内容怎么样呢。

赌博和游戏有一个共同的元素:随机性。

游戏上的随机性有两个分类,策略随机与运气随机。前者指经过玩家的制定决策的条件具有随机性。有相当多的例子,如明日方舟肉鸽中道中遇到分路,随机出了两条后续分支需要选择。重点在于先有随机性事件,再有玩家决策。而后者指代玩家执行决策后产生了具有随机性的反馈。同样有相当多的例子,例如玩家发动攻击是否暴击。重点在于玩家先执行决策,再有随机性事件发生。

玩家往往热衷于策略随机,因为显然这样的设计能够让玩家能够具有制定决策收获反馈的体验,但是为什么游戏中依旧需要运气随机呢,因为运气随机是一个很简单增加游戏丰富度的要素,这里给出我的理解:

“运气随机模糊玩家对游戏中价值体系的认知,能够有效的提高游戏深度。”

但是与此同时运气随机也有一定的反心流设计,因为玩家在认知到当前环境是一个运气随机的环境是,往往会下意识的期待一个结果,而运气随机自然导致了玩家的期望不能每次如愿,这给予了玩家挫折感。因此导入运气随机时一定要注意有没有合适的补丁去弥补没能如愿的玩家。

运气随机与策略随机往往涉及到游戏的系统设计,属于系统策略的维度,但是具体的数值又需要数值策略来进行完善,那么,理解玩家的心流过程,理解两种随机再游戏流程中的角色,再来填充与之相关的数值表,才是比较合适的流程。

事实上,高运气高技术类的游戏我认为是一个显然的未来,比方说以大逃杀为基本模式的几个游戏,把随机放置在落地物资的环节,而后的环节引入具有技术门槛和上限的游戏环节,是一个很好的一个动态循环,也很好的扩张了可玩性的边界。

至于抽卡上的事情我其实不想多聊,准确的来说我不想在这个生活项的分类去严肃拆解游戏,真要拆解就去另外写个游戏拆解专栏了。

真切的希望大家远离黄赌毒