MDF vs ICM:重新思考 MTT 中的诈唬与防守策略

策略18小时前发布 AA27o
1 0

严格来说,最小防守频率(Minimum Defense Frequency,MDF)指的是这样一种跟注(和/或加注)频率:它能让对手那些 0% 权益的手牌,在“诈唬”和“放弃”之间无差异。这个概念经常被误用,因为即使在 Chip EV 场景里,你试图让其对诈唬无差异的那些手牌,也并不总是 0% 权益。而且,在很多场景中,对手本来就应该拥有可盈利的诈唬。

在 ICM 场景下,依然存在一些你想让对手对诈唬无差异的局面,但此时“权益”并不是衡量一手牌价值的最佳指标。锦标赛扑克的核心原则之一是:输掉的筹码,比赢到的筹码更有价值;而这会让诈唬、抓诈唬以及“无差异”背后的数学都变得更复杂。

ICM 中的 MDF

Clairvoyance Game 中的 ICM

在 Clairvoyance game 中,当一名玩家在河牌最后行动、后手筹码中还剩一个底池大小的下注量时,如果他拿着坚果牌(nuts)或绝对空气(nut low),那么在均衡下,为了最大化自己的(Chip)EV,他应该总是把坚果牌全压,同时用一半于坚果牌组合数的绝对空气去诈唬。因为一个底池大小的下注给了对手 2:1 的跟注赔率,所以这个玩家通过 2:1 的价值牌:诈唬牌比例,让对手在抓诈唬时处于无差异状态。

类似地,拿着 bluff catcher 的玩家,在均衡下为了最大化自己的(chip)EV,应该以 50% 的频率跟注。因为一次诈唬是冒着 1 个底池去赢 1 个底池的风险,所以 1:1 的跟注:弃牌比例,会让下注者在“诈唬”和“放弃”之间无差异。

如果要在求解器里模拟这个游戏,我们可以:

  • 将 BTN 的范围设为 {AA, QQ},将 BB 的范围设为 {KK}
  • 公共牌面设为 22233

(我们甚至不需要 node lock BB 让他强制过牌,因为无论如何他都没有下注动机。)

下面这个自定义模拟,用 chip EV 还原了 Clairvoyance game。

引入 ICM

在某个平行宇宙里,这手牌发生在一场 1000 人 MTT 的泡沫圈附近,而且两名玩家都拥有平均筹码量。下面是新的整体下注策略

ICM 中的 MDF

具体来说,诈唬候选牌竟然有大约 93% 的频率会开火!

ICM 中的 MDF

这有点违反直觉,因为在泡沫圈诈唬的风险要高得多。BTN 若诈唬成功所赢得的 10bb,远远不如自己最后那 10bb 有价值;而一旦诈唬被跟注,他失去的正是这最后的 10bb。那么,为什么他反而会更频繁地诈唬呢?

要记住,诈唬的目的(以正确频率进行)是让对手在抓诈唬时无差异。所以,当你思考诈唬时,必须把它放在“抓诈唬”这个关系中一起思考。这正是理解上面策略为何转向更多诈唬的关键。单看诈唬本身,在泡沫圈风险更高,当然没有理由诈得更多。问题在于,抓诈唬在泡沫圈同样也更危险。

事实上,在这两者之中,抓诈唬在这里甚至更危险,因为绝大多数时候它都会导致直接淘汰。即使在这个场景里,BTN 的价值下注频率仍然略高于诈唬频率,这意味着 BB 跟注时输的次数会多于赢的次数。

当然,由于底池里已经有一个 10bb 的底池大小下注,BB 一旦抓到诈唬,赢到的筹码量会是撞上价值牌时损失筹码量的两倍。这正是为什么在 cEV 版本的游戏里,BTN 会以 2:1 的比例进行价值下注和诈唬。但在 ICM 加入后,赢下 20bb 远远称不上是“失去最后 10bb 的坏处”的两倍,因此 BTN 必须更频繁地诈唬,才能让 BB 至少愿意考虑跟注。

与 BB 的 bluff catch 不同,后者经常会输(52% 的时候输掉),BTN 的诈唬通过率则更高(65% 的时候成功)。在这个 ICM 场景里,尽管 BTN 更可能是在诈唬,BB 实际上却比在 chip EV 中跟得更少:

ICM 中的 MDF

这是因为,抓诈唬的目的(以正确频率进行)是让对手对诈唬无差异。对于进攻者来说,诈唬本身风险很高,所以他必须预期诈唬能相当频繁地成功,才值得去承担这个风险,而且这个成功频率要比 chip EV 场景下更高。

下注尺度

与 chip EV 不同,ICM 场景下,相关玩家之间并不是零和的。一场大碰撞对双方都不利,因为其中一人将失去某样东西(自己最后的 10bb),而这东西的价值要高于另一人所赢得的东西(在本就高于平均的筹码堆上再多出 10bb)。

这部分价值会被锦标赛里的其他玩家“分走”,尤其是那些正焦虑等待泡沫破裂的短码玩家。即使是没有系统学习过的玩家,对这一点往往也有某种直觉上的理解。在大型锦标赛泡沫圈,有玩家失去最后筹码被淘汰时,常常会引来欢呼,因为这意味着其他所有人都已经锁定了 min-cash。

这就是为什么我们会看到这样一个违反直觉的均衡:尽管 BTN 诈唬得更多,BB 在泡沫圈却跟得更少。在 ICM 版的“胆小鬼博弈”中,一次正面碰撞对双方都很糟,尤其当碰撞涉及他们最后的筹码时更是如此。进攻者之所以更频繁地诈唬,是因为他们预期对手会更频繁地弃牌。诈唬往往让他们在不发生那种灾难性碰撞的情况下直接赢下大底池。

而防守者则会更频繁地弃牌,即便他们知道进攻者更常在诈唬。一旦下注已经摆在那里,避免碰撞的唯一方式就是弃牌。那种碰撞的代价实在太大,以至于即使跟注往往能赢下一个很大的(但依然不值得的)底池,他们仍然有动力去避免它。

带着这个思路,我们来看看当进攻者可以选择不同下注尺度时,会发生什么:

ICM 中的 MDF

在 chip EV 语境下,拿着极化范围的玩家会希望下注越大越好,即使那意味着全压到一个相当于底池一百万倍的尺度。只要他不会缺少可用来诈唬的手牌组合即可。在这个场景中他确实不会缺,因为无论下注多大,他的诈唬频率都不该超过 50%。因此,下注越大,只意味着更多“不可被利用”的诈唬。只要下注尺度足够大,他本质上就几乎能拿走整个底池。

但在 ICM 语境下,用价值牌多赢一个大盲,远远不如用诈唬失去自己最后筹码那么糟糕,所以他会采取稍微保守一点的做法,给自己留下一些空间,希望即使诈唬失败也还能苟进钱圈。或者,如果他是在做价值下注,那么这种做法也等于在向对手表达:自己同样在对“诈唬失败”的风险做对冲。

注意,他们在下注尺度上依然相当激进,更偏好下注到剩余筹码的 80%-90%。因为自己最后那点筹码才是最有价值的部分,也是他们真正想保住的部分。至于其余筹码,他们更愿意投入下注中,因为更大的下注有利于支持更多诈唬,并且在价值下注被跟注时也能赢得更多。

需要说明的是,这和锦标赛其他阶段常见的那些“并非完全全压”的下注是不同现象。虽然锦标赛里始终存在某种 ICM 效应,但在更早阶段,故意留下一点筹码的主要原因,是为了在输掉这个底池后,仍然能在下一手利用盲注和前注带来的超高赔率,把这些筹码再次投入。

但这里并不是这种效应,因为这个模拟并没有纳入任何未来局面的考虑。

向下漂移与薄价值下注

最后我们再看一个玩具模型,它展示了 ICM 的另一个重要原则。Dara O'Kearney 和 Barry Carter 将其称为“downward drift(向下漂移)”。这个游戏与 Clairvoyance game 相似,但有两个重要区别:

  1. BTN 的范围由所有口袋对子 44-AA 组成:{44, 55, 66, 77, 88, 99, TT, JJ, QQ, KK, AA}。BB 的范围由所有口袋对子 77-QQ 组成:{77, 88, 99, TT, JJ, QQ}。也就是说,BTN 依然拥有更极化的范围,但中间部分现在有了一些重叠。
  2. BB 不允许加注。他必须先过牌,然后无论面对什么下注尺度,都只能选择跟注或弃牌。

当允许 BTN 使用多种下注尺度时,下面是他在这个游戏中的 chip EV 策略:

ICM 中的 MDF
BTN 河牌策略:chip EV

ICM 中的 MDF

拿着 QQ+ 时,他会全压。这些牌全都无法被击败,不过 QQ 有时会平分底池,因为它也存在于防守者的范围中。

50% 底池下注是给 JJ 用的。虽然 Jacks 全压也有盈利,但更小的下注尺度会激励 BB 用更宽的范围跟注,而在这个更宽的跟注范围面前,Jacks 的优势更大。由于防守者不允许加注,更强的手牌就永远不会和这个更小的下注尺度混合使用。

77-TT 的权益太高,不能拿来诈唬;但又不够强,无法拿来做价值下注(至少在这个模拟所允许的下注尺度里是如此)。

诈唬则来自 44-66 的任意组合。这些牌的价值都同样低,而且都不会与防守者的范围产生阻断或互动,所以尽管诈唬频率很重要,但究竟把哪些组合分配给哪个下注尺度并不重要。

注入 ICM

现在来看同一个游戏,只不过它发生在一场 1000 人锦标赛的泡沫圈:

ICM 中的 MDF
BTN 河牌策略:ICM(泡沫圈)

ICM 中的 MDF

即使是坚果牌,采用 90% 底池大小的下注也比直接全压(100% pot)更优,这和我们在 ICM 版 Clairvoyance game 里看到的一样。

与 chip EV 模拟不同,QQ 更偏好 70% 底池的小一些下注。因为防守者抓诈唬的动力降低了,所以当面对全压时,Queens 更常与那些会跟注的手牌打成平分。70% 底池依然能榨取很大的价值,同时还能激励更多较差牌来跟注。

出于同样的原因,JJ 也缩小了下注尺度,从 50% 底池变成了 30% 底池。

诈唬仍然可以同样自然地分配进任何下注尺度中。整体诈唬频率更高了,因为正如我们在最初的 clairvoyance game 中看到的那样,这是在泡沫圈让 BB 对抓诈唬无差异所必需的。

这也就是为什么,随着下注尺度变大,BTN 在泡沫圈与在 chip EV 中的诈唬频率差距会呈现不成比例地扩大。

结论

ICM 改变了围绕诈唬与抓诈唬的激励结构,也因此改变了最优的诈唬频率与抓诈唬频率。当风险溢价很高时,基于 MDF 和 cEV 模拟形成的直觉会变得不再可靠。更好的做法是按照以下启发式原则来调整:

  • 在锦标赛中,失去筹码的坏处大于赢得筹码的好处。上行小于下行,这就产生了风险溢价。
  • 风险溢价会恶化你在 ICM 调整后的底池赔率,从而削弱跟注动机。简单说,抓诈唬变得没那么有吸引力。作为进攻者,理论上你应该更频繁地诈唬,或者使用更小的下注尺度,来让对手在跟注和弃牌之间无差异。
  • 不过,风险溢价同样也会降低诈唬成功后的奖励。这意味着为了让对手对诈唬无差异,你也应该更频繁地弃牌,尤其当诈唬会让对手冒上最后全部筹码的风险时更是如此。
  • 锦标赛会激励所有人都更规避风险。但抓诈唬天生就比诈唬更危险。因为当你抓诈唬时,你必然会发生正面碰撞;而诈唬只有一部分时候才会导致碰撞。
  • 你最后那点筹码是最有价值的。当你非常接近泡沫圈或下一档奖金跳跃时,哪怕只保住 1 个大盲,也可能让你拿到一笔(更高的)奖金。在河牌下注时,可以考虑下得略小于全压。这样做会让你的价值下注少赢一些,但能避免你在诈唬时失去最后全部筹码,或者在价值下注被更强牌跟注时彻底出局,而后者要重要得多。


以下为基于提供的 source snapshot 所做的全文中文翻译,并已对原始提取文本中的乱码、缺失撇号和损坏字符进行了语义修复与规范化,例如将损坏的范围记法还原为 44-AA、77-QQ 等;图片顺序与 source_url 保持不变。

© 版权声明

相关文章