追本之箭 — 善猎者善守
追本之箭 — 善猎者善守
2026-04-15 Wed 19:33
起点
善猎者善守。
通常的读法是英雄式的:"最猛的进攻者也最懂防守。" 攻守一体,守是攻的副产品——省下能量、保住自己,以便下次再攻。一套很顺滑的话。
但这套读法把"守"当成了自我保护。错的。
把狩猎拆到最小:一次得手,靠的不是力气,是猎物不知道你要来。被看见的捕食者,不是捕食者。羚羊一旦把你算进它的世界,你就追不上了——它早就改了路线。所以一击的全部威力,买自出击前那段死寂。
于是"守"的真身翻转:它守的不是你的身体,是猎物脑中那张"什么都没发生"的错误地图。这张错误地图,是你这一击唯一能花的钱。出击是取款,守是存款。存的不是子弹,是敌人的无知。
这就引出一个反直觉的账:你越是频繁地、显眼地出手,你越穷。 不是因为脱靶,是因为每一次被看见的动作,都在教育猎物——把"这里有个捕食者"一点点写进它的模型,让你下一击能花的惊讶越来越少。勤猎的人,是在用自己的勤奋,一刀刀贬值自己未来的每一击。
所以问题不再是"攻还是守"。是:那笔叫惊讶的存款,到底存在哪、怎么存、又怎么在你没察觉时漏光。
第一层:伏击 —— 这一击,在你动之前就已经赢了或输了
先落到地面上最朴素的事实:狩猎有两种活法,而它们的账完全不同。
- 追猎者(pursuit):猎豹、狼。靠速度与耐力,动起来再说。
- 伏击者(sit-and-wait):鳄鱼、螳螂、蜘蛛、安康鱼。几乎不动,让世界自己撞上来。
猎豹很猛,但它的账很脆:每次高速追逐烧掉巨量能量,成功率并不高,得手了还常被鬣狗坐享其成。鳄鱼几个月可以几乎不动,一次得手就够很久——每焦耳能量换来的肉,远多于猎豹。
关键不在"谁更强",在于:伏击者把一次得手的成败,押在了"出击之前"。 它选位置、它隐蔽、它等。真正的猎杀动作只是一个标点;那句话的主体,是前面那一长段静止。
出击是瞬间。狩猎是那段静止。
善猎者善守——他守的,是出击前那段决定一切的静止。
到这里"守"还像是"省事"——少动少耗,合算而已。
第二层:泄露 —— 动一下,就给敌人发了一条情报
因为猎物不是石头。它是一个会适应的对手。
在一个不会学习的世界里(纯静态),可预测的捕食者照样吃饭——石头不会反推你的套路。但真实世界是协同演化的:猎物也在进化,它的全部生存技能,就是建一个关于你的模型(Red Queen / 红皇后假说,Van Valen 1973——双方必须不断奔跑,只为留在原地)。
在这种世界里,动作的真实成本不是卡路里,是情报。你每一个可见的动作,都是一条发给猎物的报文:
"一个捕食者,会在这里、这个时刻、用这个方式出现。"
猎物收下这条报文,更新它的模型,然后绕开你。
这就是为什么蛮力不是约束、隐蔽才是约束:一个力大无穷但行迹可循的捕食者,会被整个种群学会、被路线避开;一个不强但谁也读不到的捕食者,反而吃得到。在协同演化的军备竞赛里,胜负手从"打得多重"转移到了"漏没漏出去"。
把这翻译成 Fish 的语言:一笔足够大的单子砸进市场,冲击成本不是手续费——是你把"这里有个大买家"这条情报,免费发给了所有对手,他们立刻 front-run 你,你的 edge 当场流血。这就是为什么要拆单、要 iceberg、要 TWAP:不是省钱,是止血——止住情报的血。
第三层:惊讶 —— 那笔存款,单位是 bit
能称重。它的单位是惊讶,而惊讶有精确的数学定义。
香农(Shannon, 1948)给出:一个事件的信息量(self-information)= −log p。
越是没料到的事(p 越小),发生时携带的信息越多——惊讶越大。
把它接到猎杀上:
一击的收益 ∝ 出击那一刻,猎物的预测误差。
kill ≈ k · 惊讶 = k · (−log p_猎物(你出击))
如果猎物给"此刻有捕食者出击"赋了高 p(它早料到了),它早就跑了 / 早就把价格 price-in 了——你这一击落空,收益 ≈ 0。一击真正兑现的,是猎物的模型与现实之间那道缝,而这道缝,以 bit 为单位。
于是"守"和"猎"在同一个量上塌缩,清清楚楚:
- 守 = 把 p_猎物 压低(你不在它的模型里,−log p 很大,存款在涨)。
- 猎 = 把积累的低 p,在一次高惊讶里花掉。
最狠的是:惊讶是会被消耗的,而"被看见"就是消耗它的动作。
每一次可见的出手,都是猎物用来更新后验 P(这里有捕食者 | 观察) 的一个样本——它把你的 p 往上推。你下一击能花的惊讶,因此变少。这就是起点那笔账的机制级答案:勤猎致穷,不是因为脱靶成本,是因为可见度在系统性地销毁你下一击的本钱。 你在用今天的出手,贬值明天的每一击。
注意这里发生了一次彻底的视角反转:寻常的"善猎"讲的是猎手如何读懂世界发来的信号;而真正的命门是——你才是那个信号,猎物才是那个读信号的人。 善守 = 让自己读不出来。存款只有一个入金渠道:沉默。没有第二条。
(Fish 域:一个 alpha 策略,从被发现到被 crowd,edge 单调衰减到零——alpha decay。不是策略变笨了,是它被对手读懂了,p 升到了 1,惊讶清零。你卖出的从来不是"聪明",是"别人还不知道你聪明"这件事。)
第四层(killer):对称陷阱 —— 存款会蒸发,而瞄准要付费
这一层是命门。"守"有两个方向相反、长得却一样的死法。
死法一:过曝(花得比存得快)。
你出手太频太显,惊讶花得比攒得快 → 猎物被你教会 → edge → 0。这是乱猎,前一层已经说透。
死法二:永伏(以为存款不蒸发)。
这是更隐蔽、更多人中招的那个。永不出手 → 惊讶存到无穷?错,因为存款不是冻在银行里不动的。 它从两个口子漏:
漏口 A——信息有半衰期。
猎物对你的模型不是定格的。"这里很久没动静"本身也是情报——它会硬化成一条结论:"此处无捕食者。" 注意,这不是把你存成"低 p 的捕食者",而是把你从模型里删除:你不再是"还没出手的威胁",你是"不存在的东西"。生态位被别人占了。你攒的不是惊讶,是无关。
无关的惊讶花不出去——没人会被一个它根本没在建模的东西吓到。这是"守得太久"的真实死法:不是被打死,是被遗忘到出局。
漏口 B——瞄准即暴露(出击的双向性)。
要打出高惊讶的一击,你必须瞄准——拿到猎物的精确状态。可获取信息要求与猎物耦合,而耦合在原则上是双向的:你瞄得越准,你越得把"我在瞄你"这件事暴露出去。
这有物理硬底,不是比喻:任何作用于世界的不可逆动作都要耗散能量(热力学第二定律;Landauer 1961:哪怕只擦除一个 bit,也至少耗散 kT·ln2 的热),而耗散必然留下可探测的痕迹——热、动、声、订单簿上的一笔。不存在免费的、零泄露的真实动作。 你能延迟它、遮蔽它、把它挪个地方,但不能让一个真实的动作彻底无迹。这是一条守恒律:可探测性守恒。
所以"守"的底,根本不是"藏一辈子"。是:一记真实的出击买不到免费的惊讶——你花掉的惊讶,必须由代价高昂的沉默存进来,而沉默本身在蒸发。 守与猎被一条守恒律拴住,不是一场意志力的比赛。
两条可证伪的判据,把"埋伏"从"失踪 / 过曝"里切出来:
判据一(存款 vs 蒸发): 你按住不动的此刻,对手脑中你的模型,是在变空(你在降 p、在攒惊讶),还是在硬化成一条"这里很久没动静"(你在被遗忘、从模型里出局)?
变空 → 守(埋伏)。硬化成无关 → 那不是守,是失踪——你攒的不是惊讶,是无关。
判据二(净惊讶): 把这次出手所需的"瞄准"砍到最小(接受更差的精度),你还出不出手?
出 → 你之前怕的是暴露,瞄准泄露 > 这一击的收益,按住是对的(净惊讶为负)。
还要"看得更清再动" → 你在为瞄准付费,而瞄准本身在泄露——你正反向给对手攒着关于你的 P。
净惊讶 = 落地惊讶 − 瞄准时已泄露的惊讶。守得住的人,守的不是"不动",是这个差值为正。
第五层:两个世界 —— 不会学习的猎物,与会学习的对手
裂缝逼出一个分叉。你脚下是哪种猎物,决定了"守"是两件完全不同的事。
世界一:不会学习的猎物(被动世界)。
鹿、潮汐、一台不带记忆的撮合引擎。它不建模你。这里的惊讶不是策略性的,只是物理可探测性——你的影子、你的脚步声、你挂进簿子里的那一笔。
→ 守 = 物理隐蔽。你不需要"不可预测",只需要"不被看见"。
→ 这里,一份写死的固定计划完全 OK——鹿不会因为见过你三次出手就反推你的作息。底是上一层那条热力学守恒律:管好你的泄露就够了。
世界二:会学习的对手(适应性世界)。
另一个交易员、一个竞争者、一个跟你过招的人。它不只建模你,它还建模"你在建模它"。
这里物理隐蔽不够了。因为任何 pattern,哪怕没被看见,一旦被推断出来,就可被利用。你藏住了身形,藏不住节律。你引以为傲的"纪律"——总在同一条件下出手——恰恰是对手能反推、能埋伏的训练数据。
于是钻到了最后的底,一个逻辑/存在的底:
对一个能把你的策略模型化的对手,唯一学不会的 pattern,是没有 pattern。
零和对抗预测的最优解,是混合策略——随机化(von Neumann 极小化极大定理,1928;Nash 均衡,1950)。"我猜你猜我猜你……"这条递归在纯策略里没有不动点,它唯一的不动点是随机。
推到尽头,一句反直觉到刺人的话:
要让对手测不准你,你得先让自己也测不准自己。
任何你能内省到的规律——一条规则、一个 tell、一份你自己说得清的计划——原则上都可被足够聪明的对手推断,因而可被利用。所以最深的守,是守住你自己的不可预测性,包括对你自己隐藏它。
这正面顶撞了"把计划写死、到点执行"那条民间智慧:对会学习的对手,一份 legible 的计划,就是你亲手喂给它的训练集。 最受控的猎手,在这一层必须交出对自己出手时机的控制权——以失控,达成不可被预测。这是守的存在悖论:控制的极致,是放弃控制。
(对称的 bear case,别走反:这条"随机化"只对适应性对手成立。在被动世界里随机化是愚蠢的——那里你恰恰需要一份刚硬、可复用、不被情绪改写的固定计划。用错世界,两个方向都是死: 对鹿玩随机 = 浪费纪律;对会学习的对手玩固定计划 = 把命门递过去。)
终点:出手前,先认你的猎物会不会学习 + 两张自检
钻到底,"善猎者善守"不是"攻守一体"的心法。是一套关于惊讶的出纳流程:守是存钱,猎是取钱,而存款会蒸发、取款要付手续费。但跑流程之前,先问一个决定一切的前置问题——它定了你接下来用哪套规矩。
判据零:你的猎物,会不会学习你?(选规矩)
这个对手,会不会因为"见过你出手"而改变下次的行为?它建不建一个关于你的模型?
- 不会学习(被动世界:鹿 / 撮合引擎 / 物理空窗) → 守 = 物理隐蔽。管住你的可见度泄露。固定、写死的纪律计划是对的——没人会反推它。
- 会学习(适应性对手:对手盘 / 竞争者 / 人) → 守 = 消灭可被推断的 pattern。物理隐蔽不够;任何节律都是食物。必要时随机化——让对手、乃至你自己,都测不准你下一手。
先认猎物,再选规矩。把对鹿的固定计划用在会学习的对手身上,等于把命门递给它。
判据一:这一击,还有多少惊讶可花?(估 −log p)
对手现在给"我出手"赋的 p 是高是低?它料到没有?
我每一次可见的动作,是不是都在把这个 p 往上推、贬值我未来的每一击?
p 已经很高(被料到 / 已 price-in) → 这一击收益趋零,别花。
判据二:我的存款,在涨还是在蒸发?(查衰减)
我按住不动的此刻,对手对我的模型在变空(攒惊讶),还是硬化成"这里很久没动静"(被遗忘、出局)?
我攒的是惊讶,还是无关?
硬化成无关 → 那不是守,是失踪。给守设一个衰减闹钟:惊讶有半衰期,生态位会被占。
判据三:瞄准的泄露,盖得住出击的收益吗?(算净惊讶)
净惊讶 = 落地惊讶 − 瞄准时已泄露的惊讶。
我为了"看得更清"多等的每一刻,是不是在反向给对手攒关于我的 P?
净惊讶为负 → 瞄准比出击更贵,按住是对的,不是怯。
自检 A:这是"埋伏"还是"失踪 / 过曝"?
| 你以为你在"守" | 真实结构 | 戳穿它的信号 |
|---|---|---|
| 在积累惊讶 | 在被遗忘(衰减) | 对手模型里你已不存在——不是低 p,是出局 |
| 在隐蔽 | 在过度暴露 | 每个"小动作"都在教育对手,每一击在贬值 |
| 在埋伏 | 对手会学习,而你有可被反推的节律 | 你引以为傲的"纪律"=对手的训练数据 |
任意一行命中右侧 → 你不是在善守,你在用"善守"给失踪、过曝或泄露发通行证。
自检 B:这一击,净惊讶为正吗?
| 问自己 | 是 → |
|---|---|
| 对手已经料到我会出手了吗? | 是 → p 太高,惊讶≈0,别花 |
| 我瞄准所泄露的,比这一击能拿的多吗? | 是 → 净惊讶为负,按住 |
| 我"按住"时,是在攒惊讶,还是在被遗忘? | 被遗忘 → 不是守,是失踪,该动了 |
| 对手会不会反推我的出手节律? | 会 → 消灭 pattern,固定计划在这里是漏洞 |
三个该(把上表翻成动作)
✅ 先认猎物会不会学习,再选规矩——被动世界:物理隐蔽 + 写死的纪律;适应性对手:消灭 pattern,必要时随机化(治判据零的死)
✅ 记"暴露账"——每个可见动作都在拉高对手对你的 P、贬值未来每一击;像记交易一样记下你的可见度(治判据一)
✅ 给守设衰减闹钟 + 算净惊讶——惊讶有半衰期,别从"埋伏"烂成"失踪";瞄准泄露 > 出击收益时,按住手(治判据二、三)
收口
善猎者善守,不是因为他攻守皆能,也不是因为他无我如水。
是因为他认清:一击的全部威力,买自出击前那段没人察觉的死寂——守是存款,猎是取款,存的是敌人的无知。
- 对不会学习的世界,他守的是身形——别被看见,然后照着写死的计划,在猎物撞上来时果断收割。
- 对会学习的对手,他守的是自己的不可预测性——连他自己都说不准下一手,因为任何说得清的规律,都是递给对手的刀。
按住不动,是在攒惊讶;出手,是在花惊讶。守得太久会蒸发成无关,出手太勤会教会对手。
差别只在那一刻:信号来时,你的不动,是在为这一击攒钱——还是你早已被遗忘,攒了一辈子无人会惊讶的惊讶。
(箭到底了。)
