- 转载 / 翻译自:GTO Wizard Blog
- 原文标题:How Pros Use Solvers To Crush Pool Leaks
- 原文链接:https://blog.gtowizard.com/how_pros_use_solvers_to_crush_pool_leaks/
- 原文发布时间:2025-10-24T08:23:11.000Z
- 授权说明:已确认具备全文翻译转载授权。
用 solver 学习时,很容易陷入一种误区:视野变窄,忘了自己最初到底是为了什么而研究。Solver 的确是极好的工具,能帮助人理解不同线路里各种手牌想做什么,但海量信息也常常把新手带偏,让他们偏离最核心的目标:创造 EV。
今天,我会带你走一遍我自己使用 solver 学习的方法。这次我选的牌局场景是:SB vs BB 的 SRP,IP 在转牌圈延续下注(也就是翻牌圈对手过牌后我们 stab,到了转牌又获得继续 barrel 的机会)。
注意:如果你研究的是博弈树后段的决策点,最好先对相关的父节点有过学习,至少是最近学过一些。本例中,这意味着在研究这条线之前,你最好已经比较清楚翻牌圈 check-call 这条线是如何运作的。
建立学习目标
在深入之前,先列出一些研究问题,明确你到底想调查什么,这一点非常重要。对于这个场景,我会先头脑风暴出 4 到 5 个问题(下面会列出我的问题)。要记住,在研究过程中你常常会遇到一些出人意料的输出结果。这些都很适合加入你的知识库,但无论如何,都要不断回到最初的问题上,确保整个研究过程始终沿着正确方向推进。至于探索过程中发现的那些“彩蛋”,可以先记下来,留到之后单独开一轮学习再处理。

在设计这些学习目标时,脑中一定要始终把“创造 EV”这个总目标放在最前面。如果你对某个场景的运作机制几乎完全陌生,那就应该把理解它本身当成头号优先事项。接下来的其余学习,都应服务于一个更大的目标:研究当你面对真实对手时,激励会怎样发生偏移。
概念性问题
这个节点里的价值下注门槛是什么?可以按不同类型的转牌来思考,例如:
- blank 转牌
- 高张转牌
- 补成同花的转牌
- 会改变 nuts 分布的转牌,对 IP 和 OOP 双方都是如此(例如 T643、7424、A62K、KJ4T 等)
哪些类型的手最适合拿来 bluff?在哪些牌面结构上,我们需要拿大量纯空气牌(未成对且没有听牌的手)去 barrel?
我的对手有多 capped?
- 在这个节点里,他们理论上最强能拿到哪一类牌?这类牌大约占他们范围的多少百分比?这个问题同样会非常依赖具体是哪一张转牌。
战术性问题
基于我目前对真人玩家在某些牌面上如何打翻牌圈的理解,在不同类型的公共牌上,我的激励会怎样变化?
- 我认为,在 A 高牌面或 K 高牌面上,真人玩家翻牌圈用 XC(check-call)的范围通常会非常集中而且偏 capped,主要由中等强度的成手组成,因为他们会把更多那些带摊牌价值、原本也可能 XC 的空气牌直接拿去下注。所以我们想研究的是:这会怎样改变我们在这个节点中的下注策略。
- 在两同花面上,我通常会假设真人玩家作为 OOP 会拿过多的即时听牌在翻牌圈下注,因此一旦他们翻牌圈选择过牌,他们在补成同花或顺子的转牌上可能会过度弃牌。
如果我的对手在 B-X-B 这条线里,没有足够多会在河牌 bluff 的空气牌存在(从而导致我从对手河牌 bluff 频率中获得的 EV 下降),那么我是否应该把更多价值提前到转牌圈兑现?
概念(理论)
在这篇文章里,我们只看一种翻牌面,用它来说明我的学习策略。这篇文章的重点是把握整体思路,所以不会展开到极端细节。
下面我列出了在 Ts8s2d 这个翻牌面上,IP 面对 5 张不同转牌时的 c-bet 策略。除了转牌报告本身之外,我从这些信息中提炼出的关键结论,也会一并总结在下面。
Ts8s2d 上的 IP 转牌 c-bet 策略

Ts8s2d4h

Ts8s2dKh

Ts8s2dAh

Ts8s2d6s

Ts8s2d9h

到这里,其实已经有很多值得消化的信息了。我在学习时做笔记,通常会根据关键观察点,把脑中的“人脑 solver”结论简洁总结出来。下面我会把这些关键观察以及对应的思维总结都列出来,展示我是怎么做这件事的。
关键观察:
- Blank 转牌:我们的价值下注门槛显然大致在 JT+ 附近,KT+ 则是纯下注。这里会倾向于使用一个小幅 overbet。
- 高张转牌:原本的顶对、现在变成第二对的 Ten-x,我们很少继续 barrel;但当我们在转牌刚好形成新的顶对时,会相当激进地继续下注。
- 补成同花的转牌:强 Ten-x 不再是理论上的必下注手牌,而且我们的下注尺度会缩小。
- 补成顺子的转牌:以 9 为例,它会让双方范围里都多出大量顺子,这时会出现类似情况。我们更倾向于继续 barrel 那些权益更高的 Ten-x,比如 QT/JT;这些牌在 blank 转牌上本来不会那么常继续开火。
- 各种补成听牌的转牌:看起来我们会更有动力在尺度选择上更灵活。我们的顶对仍然会以一定频率下注,但它们不再像 blank 转牌那样值那么多大盲,因此 solver 会用分裂尺度来适配这种情况。
思维总结:
价值:
- OOP 在翻牌圈通常会拿 overpair 和部分 AT 去下注或 check-raise(XR),所以当转牌没有为 OOP 带来显著数量的新 nuts 组合时,KT+ 就是那些想继续往底池投入大量筹码的门槛手牌。
- 虽然 OOP 的翻牌圈 float 范围里会有不少 AK/KQ,但当我们在转牌新形成顶对时,这类牌仍然足够强,值得继续下注,从 OOP 翻牌圈 XC 的大量中弱成对组合中榨取价值。
- 这很可能和 OOP 构建翻牌圈 XC 范围的方式有关:在像这种中等强度、偏湿润的翻牌面上,OOP 不会用太多纯 A 高或 K 高去 float,因此当我们的 King-x 在转牌击中时,往往会相当强。这一机制在 T62r 上可能就不同了,因为在那种牌面上,OOP 翻牌圈会用更多像 KQ、KJ 这样的牌去 check-call。
- 虽然逻辑相近,但当转牌是一张 A 时,运作方式又会略有不同,因为 OOP 的 float 范围里强 A 高的密度会相对更高。因此,我们那些翻牌圈下注过的较弱 Ace-x,往往可以在转牌选择过牌,转而做 bluff-catch。
- 当转牌补成听牌时,我们的下注尺度会下降,原因在于:
- 当听牌补成时,Villain 的 capped 程度会明显下降。
- 当顺子补成,而且是双方范围里都可能拥有的顺子时,我们更倾向于拿带 blocker 的顶对去下注,这些 blocker 同时还能提供后备权益。
- 当同花听牌补成时,也存在类似机制。不过这里有个细节值得特别注意:
- 如果我们是在拿较薄的价值牌下注转牌(例如 JTo/QTo),那么我们更希望自己带有黑桃 side card,这样在落后时还保留一些后备权益。
- 而当我们持有 ATo/KTo 时,反而通常更希望自己不要带黑桃,因为对手会用带黑桃的 AK/AQ 走 XC-XC,这意味着这些手会挡住更多 Villain 的弱持续范围。
诈唬:
- 即便是在低张 blank 转牌上,这个牌面里也已经存在大量顺子听牌和同花听牌,因此我们更倾向于用这些手去 barrel 转牌,而不是用纯空气牌。
- 较低端的顺子听牌(例如 53s、63s、65s)即便摊牌价值很低,也会强烈倾向于选择过牌控制。这种模式在 IP barrel 时极其常见。更适合作为 bluff 的顺子听牌,通常是那些带有相关花色的 offsuit 组合,或者至少带有一张能高过顶对/第二对的高张,这样它们在河牌还能通过击中对子反超 OOP 的 bluff-catcher,甚至在所成之对足够强时转为价值下注。
战术(剥削)
当你研究一个偏剥削性的课题时,处理方式可以有无数种,但不要把水搅浑。你必须明确自己究竟想研究什么,然后基于你的剥削性假设,一步一步把逻辑链条展开,大致可以像下面这样。
剥削性假设及其推论
真人玩家在翻牌圈会用过多听牌主动进攻,因此:
- Villain 的翻牌圈 XC 范围会更集中于偏向摊牌的手牌。因此,当后续街道听牌补成时,他们拥有的 nuts 组合会比最优情况更少。
- 此外,Villain 在 XC-X-B 这条线里也会 bluff 不足,因为他们那些没有摊牌价值的手(在这个牌面上,典型如 QJ、97、J9 等)在这条线里会变少。
基于这一点,我们可以合乎逻辑地推测:如果上述假设成立,那么我们的成手若在转牌选择过牌,打算到河牌再 bluff-catch,表现就会偏弱。
案例研究:干燥转牌
首先,我们在 GTO Wizard 里跑一个 AI solve,建立基准线:

这个输出和我们之前看到的非常接近:顶对的大致价值门槛是 QT+,较低端的顺子听牌经常会选择过牌控制,而同花听牌加上强顺子听牌构成了 bluff 范围的主体。
下面是 OOP 在翻牌圈面对 b50 时的应对。

我们可以看到不少 AJ-AK,以及一些 KQ。像 QJ/Q9/J9/97 这样的顺子听牌,不仅有相当比例会选择 XC,而且它们在翻牌圈本身也不会以特别高的频率下注,这就给 OOP 玩家在后续街道保留了大量可以拿来 bluff 的候选手牌。
下一张图展示的是 OOP 在翻牌圈 XC 之后,进入转牌圈时所到达的范围。

当你用 solver 研究剥削性思路时(通过 nodelock、tree pruning 等方式),一定要另外打开一个完全相同的模拟副本来做修改,这样才能确保比较的是同类项。
另外,做这类实验时,先沿着你的剥削性假设对模拟做小幅修改,而不是一开始就拉满。很多时候,轻微改动就足以直接回答你的问题;也有些时候,模拟看起来几乎一模一样。你要自己多试,看看对手的偏差需要严重到什么程度,才会迫使你的策略出现显著改变。
现在,我们来调整上面的范围,让这个场景更接近现实中的打法。
提醒一下:当你修改转牌或河牌节点时,一定要把之前街道锁住,避免 solver 为了适应后续街道的剥削而重新调整前面的节点。这里要用到 “combo locking toggle”。


本质上,我做的只是:通过强制 OOP 在翻牌圈对顺子听牌下注过多,和/或用它们加注过多,从而把一部分顺子听牌组合从其转牌圈范围中移除。
继续往下看之前,你先想一想:如果转牌是一张 blank,IP 的转牌 c-bet 策略会发生什么变化?尽量具体一点,说明我们的 EV 到底来自哪里。

Ts8s2d4h 上,BB 面对经过 nodelock 的 SB 时的转牌 c-bet 策略:Exploitable
剧透一下:变化其实不大。我们的价值下注激励基本相同。因为在转牌过牌、到河牌再 bluff-catch 这条线里,我们并不会额外赚到很多 EV,所以价值下注的动机几乎没有变化。不过,这并不是最有意思的牌面类型,前面我们已经说过了。接下来看看那些会补成关键听牌的转牌。
案例研究:湿润转牌

上图:Ts8s2d9h 上 BB 对 SB 的转牌 c-bet 策略:SRP,起始 100bb,自定义 GTO 解。
下图:Ts8s2d9h 上 BB 对 SB 的转牌 c-bet 策略:Exploitable。

整体下注频率大约增加了 10%,这已经是相当可观的变化。看起来我们会更频繁地拿 Ten-x 做价值下注,因为我们不再那么担心 Villain 拥有顺子。还值得注意的是,这张牌会带来大量 offsuit 两对和暗三条组合,同时也让对手不少 bluff-catcher 额外获得一些权益。这会在一定程度上抵消转牌圈可剥削收益的幅度。
教学重点:由范围不对称带来的 EV 增益,大多会在河牌兑现。很多时候,转牌打法看起来和基准模拟差不多,但一旦你往河牌看,就会清楚钱到底是从哪里赚来的。这里就是一个例子:现在我们可以很放心地把任何 set 都 jam,也可以把任何两对都拿去做价值下注,因为 OOP 会变得更 capped。
正因为他们更 capped,当他们缺少强价值牌时,就不得不更轻地跟到底。上面那张图是面对河牌 jam 的均衡模拟,下面那张是 nodelock 之后的模拟。注意看,有多少更多的 bluff-catcher 组合被迫要继续跟注。

上图:在 Ts8s2d9h4d 上(翻牌圈 stab、转牌圈 c-bet 之后),SB 面对 BB 河牌全下(228% 底池)时的应对:GTO。
下图:SB 面对 BB 河牌全下时的应对:Exploitable。

如果转牌是一张补成同花的牌,而我们又强制 OOP 在翻牌圈拿更多同花听牌去下注和/或 check-raise,会发生什么?这个问题就留给读者自己练习了。
我们可以相当有把握地得出结论:如果对手在这条线里、面对补成听牌的转牌时,没有足够多的顺子,那么我们会通过多种方式获得大量 EV。不过,这项研究建立在一个前提之上:我们的对手会在 B-X-B 这条线里 bluff 不足。本文并没有为这个判断提供证据。在你真正调整策略之前,应该先去查看几种不同牌面在 B-X-B 线中的情况,研究这个判断到底站不站得住脚。
如果对手反而在那条线里 bluff 过度,那整篇讨论的框架就会被彻底改写。
文章到这里就结束了,因为我的主要目标是说明:我在学习一个节点时,整体上是如何展开思考的。
在设计剥削性策略时,最重要的是建立一条通向你替代性假设的清晰逻辑链,并逐个环节严谨审视,判断它是否成立。
很多时候,你会列出一串假设,而你对每个假设的信心程度也会不同,因为你所在玩家池未必都朝着同一个方向偏移。记住,最终目标始终是改进你对真实对手的策略。去设计并运行模拟,在研究过程中不断对它们做小幅调整,然后仔细观察发生了什么。把你的观察和由此产生的思考记录下来,会帮助你识别并内化背后的运作机制。
总结
- 在研究转牌或河牌节点之前,先补足相关父节点的基础知识。这样能显著提升你处理目标节点时的效率。
- 在坐下来学习之前,先明确你的学习目标;要有意识地研究。
- 在研究剥削性战术时,一定要慢一点、细一点。
- 你脑中的“人脑 solver”是你在剥削博弈中最宝贵的资产。借助运行求解算法的电脑 solver,你实际上是在强化自己脑中的那一个。
- 把你默认的剥削性假设明确写出来,并把逻辑展开说明:为什么你认为,对基准策略做某些调整,在现实中会为你带来更多 EV。
- 当你为了研究剥削而进行 nodelock 或修改模拟时,要同时观察两种情况:一种是假设只轻微成立,另一种是假设 100% 成立。这样你才能大致判断,自己究竟该多大力度去整体性剥削玩家池。
- 例如,如果 solver 只有在对手严重打错某个场景时才会部署非常激进的剥削,那么这就说明,过于剧烈的策略改动在现实中可能并不高效。
- 做好清晰的笔记。
已按要求完整翻译正文,并将原文中的花色符号统一规范为 ASCII 扑克记号(如 Ts8s2d、Ts8s2d4h、Ts8s2d9h4d),保留了术语、手牌记号、顺序与图片 source_url。原页面中的技术占位符(如 TODO snippet)未作为正文内容纳入译文。