解析博弈类规则

五子棋新闻


#1 解析博弈类规则 作者:没事摆石子玩 发表时间:2013-5-14 14:08:22

  论坛里有很多关于博弈类规则得文章,为了使大家更明白这类规则得优越性,以及对比传统类规则得异同,经过思考我也试着以比较深度得理解解析一下博弈类规则,希望对不甚明了得人有所帮助。

 要明白什么是博弈类规则,首先要明白一个概念,那就是博弈。在博弈类规则中,所谓博弈得概念非常之简单,就是一方行使连走得权利时(按顺序为一黑一白,或一白一黑),对方自动获得一次交换权,并需要马上确定交换或者继续行棋,行棋时也有两种选择,一种是单走一步(对方没有交换权此时),或者连走两步(此时对手依然有交换权),这整个得过程可以看成一个博弈得过程,在某个节点处截止。所有按照这个模式来得规则,都可以称之为博弈类规则,比较著名得有小天提出得他得博弈规则,还有连换规则,这种博弈得提法最早由小天老师提出,这可以说确实为新规则得探讨找到了一条非常不错得路。

 弄清了广义博弈规则得意义之后,我们自然会产生一系列问题,这个概念究竟意味着什么,为什么会凭空产生这个概念呢?棋手能否习惯并适应这类规则?下面我们一一来看:

1 这种博弈得概念实际并不是凭空产生得,实际有其深刻得背景,而且我们也都不陌生。回想第一个比较成熟,有竞技性得有禁规则RIF吧,看看我们能从中发现什么? 下面先用比较简单精确得语言,表述一下RIF规则得主体部分:假先方开局(当然是第一手在天元,2 3位落子有限制)走前3手棋(2黑1白),之后白棋可以选择交换或者继续行棋。当白4落下之后,黑白方都已经最终确定,第5手黑方要给出两个打点,白方去除一个之后棋局继续,黑方有禁手,白棋可以自由行棋。

 通过上述简单得描述,我们可以发现一点,假先方开局这个过程就是一个博弈过程(因为第一手确定,相当于假先方走了一白一黑,此时假后方获得了交换权!)。弄明白这一点其实我们也很惊奇吧,古老而原始的提法里已经蕴含了这个思想,只是没直接叫出来。 那么这个时候,我们就可以用几个明显而根本得特征描述RIF规则了:一次博弈、 打点(=2)、 有禁。 其他得诸如15道棋盘 天元落第一手我们暂时不想考虑,只需要观察这3个本质特征在本文。那么RIF这个规则已经应用了有30年,随着研究得深入,我们中国人完全有资格对这个规则得优劣长短有自己得判断,一次交换得存在其实已经保证了某种意义上得公平性,但是在4手之后,问题还是存在,那就是黑存在着必胜点往往。于是日本人想出了打点这个东西,进一步来约束,保证了还有平衡得棋存在。但是,这么多年过去了,深入研究得结果就是,在RIF下还存在得平衡数量很有限,甚至可以说比较稀少。具体说来除了疏星、瑞星、丘斜月、流星等几个开局理论上还可下,其他开局基本都是有结论得,即便暂时没地毯也不能看成平衡局(当然可以用来骗,我们在这里只是想考察真正意义上比较平衡得局面)。那么问题究竟出在哪里呢? 改进得方式无非是变化那3个要素,无禁类新规则基本保留了博弈性,但是去掉了禁手。我个人对无禁类规则持保留态度,至少我不认为能比得上有禁下得博弈类规则,无论是深度、广度、趣味性、竞技性都有差距应该说。

   有点跑题了,真正得重点是RIF得一个简单类推,就是保留一次博弈、打点、有禁三要素得山口规则。唯一的一点不同是把打点换成了=N(N≥1)。这规则真不愧是日本山口大师得杰作,确实保留了很浓得日本风格,就是不喜欢大得变革,要以最小得改动来解决问题。但是这个微调也带来了问题,首先,生命力不强得硬伤依然存在。按照中国人得研究速度,5到10年山口也可以寿终正寝,什么是必胜,什么是必败,哪些是仅存得能下得棋会非常清楚,RIF得今天毫无疑问就是山口规则得明天。这种规则只能作为过渡,而远非终极规则。其次,这个规则很繁琐,感觉要解释一下打点为什么是N,N可以多大,可不可以要几十个打点或者更多的打点给初学者听都很麻烦,不利于推广完全。那么我们依然要盯着这3要素,改革不彻底,不疼不痒得原因到底在哪里呢? 我相信看到这聪明得读者应该已经发现了,把注意力集中在打点这个元素上做些小修小补根本无济于事! 这种改变不是质变,只是量变。山口规则实际也就是个5到10倍得RIF,如此而已。那么真正得解决之道在哪里呢,如果我们想保留博弈和禁手? 这个时候,其实博弈就自然而然得进入了我们得视线,利用好这个博弈思想,能为我们带来什么? 我们用具体得一个山口规则不成功得个例来展开:

  如图,这是再简单不过得一个开局了,新月开局。但是很遗憾,这个开局在山口规则中不可下理论上(包括山月开局)。原因非常之简单,这个4出现之后,叫2打黑必胜,但是除了两个必胜点之外,其他得5手均为黑必败! 山口规则里这类尴尬其实不少,本意用来平衡黑白得打点数N没起到什么好作用,反而成了麻烦。这类现象得存在也进一步揭示了山口规则得劣性,这完全不是一个能让人满意得规则。

 回到我们得主题来,此时博弈思想成为了我们解决问题得利器。一次博弈确实不够用,这时候引入完全意义上得博弈规则是顺理成章之事,就是把博弈次数定为N(N≥0),保留禁手。我们惊奇得发现,原来小天博弈规则(定为8手截止),本质上就是最多允许4次博弈,连换规则最多可博弈两次,但是截止到5可能还是优于4得可能,待验证。

 那么我们已经明白了什么是博弈规则,博弈规则得容量之巨大我想无需赘言。值得注意得一点是,博弈类规则其实只用到了两个根本要素,就是博弈思想以及禁手,表述和理解起来并没有那么难,甚至比RIF或者山口还简单些,因为没有打点得概念了。因为多次博弈得效果绝对是巨大而且影响深远得,建议读者可以用类似这种规则下几盘切身感受下。回到上面那个简单得例子,假设我们使用界限为6得博弈规则,也就是最多允许5 6连下,6手之后博弈停止,那么完全可能出现下图这种局面:

 选手A开局,走第一手。选手B选择连下2 3两手,布局山月。此时A不交换,走那个山口下非常别扭得存在,斜4.此时作为B,就完全可以5 6连下,考验A棋手。5确实是此时必败,而且很弱可以说,但是6也可以下弱一些,总体上依然黑白机会均等,重新构筑了平衡。当然,这只是个具体得例子,并没有经过严格得拆解这就是很平衡。但是这种例子说明了巨大得问题,此际可能得存在比山口多了N多,不是倍数问题。完全可能存在理论上都非常平衡得博弈。

 最后在此文得结束,我谈一下我自己认为较为理想得博弈规则。假先方开局,从第一手行棋开始就可以选择单走或连走,单走时对手不可交换,连走时对手有权利选择交换或者继续行棋。最后得连走允许发生在5-6连走(我认为偶数截止要优于奇数截止,因为一个是避免某些BUG存在,其次偶数截止可以争取更多得博弈次数,而且如果每次博弈都发生刚好够,不存在单走出问题)。博弈过程结束后正常行棋,黑方有禁手,白方自由行棋。至于棋盘大小我支持15道盘,因为我没感觉到棋盘需要扩大或者缩小。 这种博弈规则得第一手落点可以限制在天元,其他棋子不限制。这是比较保守得。如果完全开放的话,应该包括第一手都不限制位置,怎么落子完全由棋手决定,不增加任何非理性限制。当然,短期内似乎很难完全开放。

 终于写完了,不知道我具体提出得0≤N≤3(N为博弈次数)规则还有没有漏洞,欢迎大家指正(似乎和大鱼不谋而合了。。。) N≤3应该已经非常优越,平衡性能应该已经可以满足我们得需要。变化量极其大了,而且表述简单,去掉了各种条条框框得限制。欢迎大家跟帖留言

[ 小红眼镜 于 2013-5-14 14:13:00 时花20金币送鲜花一朵]

[ 小红眼镜 于 2013-5-14 14:13:00 时花20金币送鲜花一朵]

[ 小红眼镜 于 2013-5-14 14:13:00 时花20金币送鲜花一朵]

[此帖子已被 没事摆石子玩 在 2013-5-14 14:41:32 编辑过]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[ 絕版賭徒 于 2013-5-14 15:00:03 时花20金币送鲜花一朵]

[此帖子已被 没事摆石子玩 在 2013-5-14 15:35:32 编辑过]

[此帖子已被 没事摆石子玩 在 2013-5-14 16:02:59 编辑过]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]

[ 秋风雾语 于 2013-5-15 16:15:15 时花20金币送鲜花一朵]


#2 Re:解析博弈类规则 作者:屏蔽 发表时间:2013-5-14 14:19:53

我以为6手博弈规则期待的恰恰不是N=3,而是包含了1次/2次单走,以及N=2次连走,双方各1的公平情形。

#3 Re:解析博弈类规则 作者:没事摆石子玩 发表时间:2013-5-14 14:22:20

确实,N等于3得可能很小。N理论上也可为0,不发生博弈。只要双方都照着疏星(或者别的什么平衡,太默契了。。。)去下,不交换也完全可能。不过这在实际中更是小概率事件。。。


#4 Re:解析博弈类规则 作者:没事摆石子玩 发表时间:2013-5-14 14:35:36

6手截止得好处是和我们得习惯5手截止只多了一手棋,不管从感官还是习惯来说都比较接近。并且最多3次博弈已经足够用,(也许最多4次博弈更佳?),但是如果截止到8手确实不如6手快,在保证博弈足够好之后尽快结束开局阶段应该是比较理想的。连换规则其实相当于博弈2次外加一个单走,截止到5从理论上分析应该不如截止到6,待考。

#5 Re:解析博弈类规则 作者:没事摆石子玩 发表时间:2013-5-14 14:54:54

顺便说一下,只要是博弈类规则,并没有绝对得优劣之分。只是博弈上限N或者说截止界限不同罢了,本质上核心思想就是通过博弈达到双方得平衡。我认为当上限N≥3之后,变化量都几乎是接近无限得。当然N越大,可能变化会更多,但是N过大也并不有利而且已经失去意义了似乎。N≤3或N≤4都非常不错,再大就已经不行了似乎,开局要用到10手以上无疑是失败得。。。N≤2似乎不如N≤3,变化量不如首先。 其次博弈上限得增加更有利于棋手找到平衡,N过小容易产生虽然博弈了,但是寻找平衡难度大或者盘面上根本找不到认为得平衡。如果停留在N=1,不管怎么变其他得条件都可以看成RIF和山口得亚种,本质上是一个级别的。 N等于0基本就是原始规则,只要去掉禁手的话。感觉还是挺圆满得这个理论,为不同层面得规则都找到了理论解释。


#6 Re:解析博弈类规则 作者:励精 发表时间:2013-5-14 17:30:24

这个连换(博弈)规则好就好在,不仅高端棋手之间可以有策略性博弈,初学者一人一手也不违反规则。这就是包容性之一。当N=1且为2-3连打时,这就是山口规则的变化,还省去了放上n个5再拿掉n-1个子的机械过程,当N=2且为2-3和4-5连打时,这就是坂田规则,当一人一手走下来,又和塔拉规则不谋而合,这就是包容性之二。现在的指定开局得出的理论,在连换规则中都能很好的延用,这是包容性之三。

#7 Re:解析博弈类规则 作者:游戏人间 发表时间:2013-5-14 22:51:51

其实还真没想过RIF的三手交换恰好就是博弈规则的一种应用。。。现在看似乎真是这样。。。不过优势也很明显,开局变成两个人共同构造,而不是单方构造单方选择了。。。

#8 Re:解析博弈类规则 作者:吉小鼠 发表时间:2013-5-15 4:35:49

感觉挺不错的样子,看来这个规则貌似很有希望,虽然我觉得要真下这个规则我肯定要被虐到体无完肤…虽然我现在就已经经常被虐到体无完肤…-_-#