追本之箭 — 善猎者善守

2026-04-15 · 5 层下钻

追本之箭 — 善猎者善守

2026-04-15 Wed 19:33

起点

善猎者善守。

通常的读法是英雄式的:"最猛的进攻者也最懂防守。" 攻守一体,守是攻的副产品——省下能量、保住自己,以便下次再攻。一套很顺滑的话。

但这套读法把"守"当成了自我保护。错的。

把狩猎拆到最小:一次得手,靠的不是力气,是猎物不知道你要来。被看见的捕食者,不是捕食者。羚羊一旦把你算进它的世界,你就追不上了——它早就改了路线。所以一击的全部威力,买自出击前那段死寂。

于是"守"的真身翻转:它守的不是你的身体,是猎物脑中那张"什么都没发生"的错误地图。这张错误地图,是你这一击唯一能花的钱。出击是取款,守是存款。存的不是子弹,是敌人的无知。

这就引出一个反直觉的账:你越是频繁地、显眼地出手,你越穷。 不是因为脱靶,是因为每一次被看见的动作,都在教育猎物——把"这里有个捕食者"一点点写进它的模型,让你下一击能花的惊讶越来越少。勤猎的人,是在用自己的勤奋,一刀刀贬值自己未来的每一击。

所以问题不再是"攻还是守"。是:那笔叫惊讶的存款,到底存在哪、怎么存、又怎么在你没察觉时漏光。

第一层:伏击 —— 这一击,在你动之前就已经赢了或输了

先落到地面上最朴素的事实:狩猎有两种活法,而它们的账完全不同。

追猎者(pursuit):猎豹、狼。靠速度与耐力,动起来再说。
伏击者(sit-and-wait):鳄鱼、螳螂、蜘蛛、安康鱼。几乎不动,让世界自己撞上来。

猎豹很猛,但它的账很脆:每次高速追逐烧掉巨量能量,成功率并不高,得手了还常被鬣狗坐享其成。鳄鱼几个月可以几乎不动,一次得手就够很久——每焦耳能量换来的肉,远多于猎豹。

关键不在"谁更强",在于:伏击者把一次得手的成败,押在了"出击之前"。 它选位置、它隐蔽、它等。真正的猎杀动作只是一个标点;那句话的主体,是前面那一长段静止。

出击是瞬间。狩猎是那段静止。

善猎者善守——他守的,是出击前那段决定一切的静止。

到这里"守"还像是"省事"——少动少耗,合算而已。

裂缝：可"少动省能"只是把守解释成廉价。它没解释:为什么"静止"本身是一件武器?动起来,除了烧卡路里,到底还泄露了什么、让我付不起?

第二层:泄露 —— 动一下,就给敌人发了一条情报

因为猎物不是石头。它是一个会适应的对手。

在一个不会学习的世界里(纯静态),可预测的捕食者照样吃饭——石头不会反推你的套路。但真实世界是协同演化的:猎物也在进化,它的全部生存技能,就是建一个关于你的模型(Red Queen / 红皇后假说,Van Valen 1973——双方必须不断奔跑,只为留在原地)。

在这种世界里,动作的真实成本不是卡路里,是情报。你每一个可见的动作,都是一条发给猎物的报文:

"一个捕食者,会在这里、这个时刻、用这个方式出现。"

猎物收下这条报文,更新它的模型,然后绕开你。

这就是为什么蛮力不是约束、隐蔽才是约束:一个力大无穷但行迹可循的捕食者,会被整个种群学会、被路线避开;一个不强但谁也读不到的捕食者,反而吃得到。在协同演化的军备竞赛里,胜负手从"打得多重"转移到了"漏没漏出去"。

把这翻译成 Fish 的语言:一笔足够大的单子砸进市场,冲击成本不是手续费——是你把"这里有个大买家"这条情报,免费发给了所有对手,他们立刻 front-run 你,你的 edge 当场流血。这就是为什么要拆单、要 iceberg、要 TWAP:不是省钱,是止血——止住情报的血。

裂缝："别泄露情报"还是太虚。给它一个单位。静止到底存下了什么、动作到底花掉了什么?那个被守住的东西,能不能称重?

第三层:惊讶 —— 那笔存款,单位是 bit

能称重。它的单位是惊讶,而惊讶有精确的数学定义。

香农(Shannon, 1948)给出:一个事件的信息量(self-information)= −log p。

越是没料到的事(p 越小),发生时携带的信息越多——惊讶越大。

把它接到猎杀上:

一击的收益 ∝ 出击那一刻,猎物的预测误差。

kill ≈ k · 惊讶 = k · (−log p_猎物(你出击))

如果猎物给"此刻有捕食者出击"赋了高 p(它早料到了),它早就跑了 / 早就把价格 price-in 了——你这一击落空,收益 ≈ 0。一击真正兑现的,是猎物的模型与现实之间那道缝,而这道缝,以 bit 为单位。

于是"守"和"猎"在同一个量上塌缩,清清楚楚:

守 = 把 p_猎物压低(你不在它的模型里,−log p 很大,存款在涨)。
猎 = 把积累的低 p,在一次高惊讶里花掉。

最狠的是:惊讶是会被消耗的,而"被看见"就是消耗它的动作。

每一次可见的出手,都是猎物用来更新后验 P(这里有捕食者 | 观察) 的一个样本——它把你的 p 往上推。你下一击能花的惊讶,因此变少。这就是起点那笔账的机制级答案:勤猎致穷,不是因为脱靶成本,是因为可见度在系统性地销毁你下一击的本钱。 你在用今天的出手,贬值明天的每一击。

注意这里发生了一次彻底的视角反转:寻常的"善猎"讲的是猎手如何读懂世界发来的信号;而真正的命门是——你才是那个信号,猎物才是那个读信号的人。 善守 = 让自己读不出来。存款只有一个入金渠道:沉默。没有第二条。

(Fish 域:一个 alpha 策略,从被发现到被 crowd,edge 单调衰减到零——alpha decay。不是策略变笨了,是它被对手读懂了,p 升到了 1,惊讶清零。你卖出的从来不是"聪明",是"别人还不知道你聪明"这件事。)

裂缝：既然惊讶是货币、可见度是消耗,那把守做到极致——永远不被看见、永远不动——岂不是把惊讶存到无穷?为什么这反而又是一种死?

第四层(killer):对称陷阱 —— 存款会蒸发,而瞄准要付费

这一层是命门。"守"有两个方向相反、长得却一样的死法。

死法一:过曝(花得比存得快)。

你出手太频太显,惊讶花得比攒得快 → 猎物被你教会 → edge → 0。这是乱猎,前一层已经说透。

死法二:永伏(以为存款不蒸发)。

这是更隐蔽、更多人中招的那个。永不出手 → 惊讶存到无穷?错,因为存款不是冻在银行里不动的。 它从两个口子漏:

漏口 A——信息有半衰期。

猎物对你的模型不是定格的。"这里很久没动静"本身也是情报——它会硬化成一条结论:"此处无捕食者。" 注意,这不是把你存成"低 p 的捕食者",而是把你从模型里删除:你不再是"还没出手的威胁",你是"不存在的东西"。生态位被别人占了。你攒的不是惊讶,是无关。

无关的惊讶花不出去——没人会被一个它根本没在建模的东西吓到。这是"守得太久"的真实死法:不是被打死,是被遗忘到出局。

漏口 B——瞄准即暴露(出击的双向性)。

要打出高惊讶的一击,你必须瞄准——拿到猎物的精确状态。可获取信息要求与猎物耦合,而耦合在原则上是双向的:你瞄得越准,你越得把"我在瞄你"这件事暴露出去。

这有物理硬底,不是比喻:任何作用于世界的不可逆动作都要耗散能量(热力学第二定律;Landauer 1961:哪怕只擦除一个 bit,也至少耗散 kT·ln2 的热),而耗散必然留下可探测的痕迹——热、动、声、订单簿上的一笔。不存在免费的、零泄露的真实动作。 你能延迟它、遮蔽它、把它挪个地方,但不能让一个真实的动作彻底无迹。这是一条守恒律:可探测性守恒。

所以"守"的底,根本不是"藏一辈子"。是:一记真实的出击买不到免费的惊讶——你花掉的惊讶,必须由代价高昂的沉默存进来,而沉默本身在蒸发。 守与猎被一条守恒律拴住,不是一场意志力的比赛。

两条可证伪的判据,把"埋伏"从"失踪 / 过曝"里切出来:

判据一(存款 vs 蒸发): 你按住不动的此刻,对手脑中你的模型,是在变空(你在降 p、在攒惊讶),还是在硬化成一条"这里很久没动静"(你在被遗忘、从模型里出局)?

变空 → 守(埋伏)。硬化成无关 → 那不是守,是失踪——你攒的不是惊讶,是无关。

判据二(净惊讶): 把这次出手所需的"瞄准"砍到最小(接受更差的精度),你还出不出手?

出 → 你之前怕的是暴露,瞄准泄露 > 这一击的收益,按住是对的(净惊讶为负)。

还要"看得更清再动" → 你在为瞄准付费,而瞄准本身在泄露——你正反向给对手攒着关于你的 P。

净惊讶 = 落地惊讶 − 瞄准时已泄露的惊讶。守得住的人,守的不是"不动",是这个差值为正。

裂缝：可这一整套——惊讶、泄露、瞄准暴露——全押在一个前提上:猎物会建模你。要是它根本不学习呢?羚羊会跑,但市场这台冷机器、一头不记仇的鹿,它们不反推你的套路。那时这条守恒律,还拴得住吗?

第五层:两个世界 —— 不会学习的猎物,与会学习的对手

裂缝逼出一个分叉。你脚下是哪种猎物,决定了"守"是两件完全不同的事。

世界一:不会学习的猎物(被动世界)。

鹿、潮汐、一台不带记忆的撮合引擎。它不建模你。这里的惊讶不是策略性的,只是物理可探测性——你的影子、你的脚步声、你挂进簿子里的那一笔。

→ 守 = 物理隐蔽。你不需要"不可预测",只需要"不被看见"。

→ 这里,一份写死的固定计划完全 OK——鹿不会因为见过你三次出手就反推你的作息。底是上一层那条热力学守恒律:管好你的泄露就够了。

世界二:会学习的对手(适应性世界)。

另一个交易员、一个竞争者、一个跟你过招的人。它不只建模你,它还建模"你在建模它"。

这里物理隐蔽不够了。因为任何 pattern,哪怕没被看见,一旦被推断出来,就可被利用。你藏住了身形,藏不住节律。你引以为傲的"纪律"——总在同一条件下出手——恰恰是对手能反推、能埋伏的训练数据。

于是钻到了最后的底,一个逻辑/存在的底:

对一个能把你的策略模型化的对手,唯一学不会的 pattern,是没有 pattern。

零和对抗预测的最优解,是混合策略——随机化(von Neumann 极小化极大定理,1928;Nash 均衡,1950)。"我猜你猜我猜你……"这条递归在纯策略里没有不动点,它唯一的不动点是随机。

推到尽头,一句反直觉到刺人的话:

要让对手测不准你,你得先让自己也测不准自己。

任何你能内省到的规律——一条规则、一个 tell、一份你自己说得清的计划——原则上都可被足够聪明的对手推断,因而可被利用。所以最深的守,是守住你自己的不可预测性,包括对你自己隐藏它。

这正面顶撞了"把计划写死、到点执行"那条民间智慧:对会学习的对手,一份 legible 的计划,就是你亲手喂给它的训练集。 最受控的猎手,在这一层必须交出对自己出手时机的控制权——以失控,达成不可被预测。这是守的存在悖论:控制的极致,是放弃控制。

(对称的 bear case,别走反:这条"随机化"只对适应性对手成立。在被动世界里随机化是愚蠢的——那里你恰恰需要一份刚硬、可复用、不被情绪改写的固定计划。用错世界,两个方向都是死: 对鹿玩随机 = 浪费纪律;对会学习的对手玩固定计划 = 把命门递过去。)

终点:出手前,先认你的猎物会不会学习 + 两张自检

钻到底,"善猎者善守"不是"攻守一体"的心法。是一套关于惊讶的出纳流程:守是存钱,猎是取钱,而存款会蒸发、取款要付手续费。但跑流程之前,先问一个决定一切的前置问题——它定了你接下来用哪套规矩。

判据零:你的猎物,会不会学习你?(选规矩)

这个对手,会不会因为"见过你出手"而改变下次的行为?它建不建一个关于你的模型?

不会学习(被动世界:鹿 / 撮合引擎 / 物理空窗) → 守 = 物理隐蔽。管住你的可见度泄露。固定、写死的纪律计划是对的——没人会反推它。
会学习(适应性对手:对手盘 / 竞争者 / 人) → 守 = 消灭可被推断的 pattern。物理隐蔽不够;任何节律都是食物。必要时随机化——让对手、乃至你自己,都测不准你下一手。

先认猎物,再选规矩。把对鹿的固定计划用在会学习的对手身上,等于把命门递给它。

判据一:这一击,还有多少惊讶可花?(估 −log p)

对手现在给"我出手"赋的 p 是高是低?它料到没有?

我每一次可见的动作,是不是都在把这个 p 往上推、贬值我未来的每一击?

p 已经很高(被料到 / 已 price-in) → 这一击收益趋零,别花。

判据二:我的存款,在涨还是在蒸发?(查衰减)

我按住不动的此刻,对手对我的模型在变空(攒惊讶),还是硬化成"这里很久没动静"(被遗忘、出局)?

我攒的是惊讶,还是无关?

硬化成无关 → 那不是守,是失踪。给守设一个衰减闹钟:惊讶有半衰期,生态位会被占。

判据三:瞄准的泄露,盖得住出击的收益吗?(算净惊讶)

净惊讶 = 落地惊讶 − 瞄准时已泄露的惊讶。

我为了"看得更清"多等的每一刻,是不是在反向给对手攒关于我的 P?

净惊讶为负 → 瞄准比出击更贵,按住是对的,不是怯。

自检 A:这是"埋伏"还是"失踪 / 过曝"?

你以为你在"守"	真实结构	戳穿它的信号
在积累惊讶	在被遗忘(衰减)	对手模型里你已不存在——不是低 p,是出局
在隐蔽	在过度暴露	每个"小动作"都在教育对手,每一击在贬值
在埋伏	对手会学习,而你有可被反推的节律	你引以为傲的"纪律"=对手的训练数据

任意一行命中右侧 → 你不是在善守,你在用"善守"给失踪、过曝或泄露发通行证。

自检 B:这一击,净惊讶为正吗?

问自己	是 →
对手已经料到我会出手了吗?	是 → p 太高,惊讶≈0,别花
我瞄准所泄露的,比这一击能拿的多吗?	是 → 净惊讶为负,按住
我"按住"时,是在攒惊讶,还是在被遗忘?	被遗忘 → 不是守,是失踪,该动了
对手会不会反推我的出手节律?	会 → 消灭 pattern,固定计划在这里是漏洞

三个该(把上表翻成动作)

✅ 先认猎物会不会学习,再选规矩——被动世界:物理隐蔽 + 写死的纪律;适应性对手:消灭 pattern,必要时随机化(治判据零的死)

✅ 记"暴露账"——每个可见动作都在拉高对手对你的 P、贬值未来每一击;像记交易一样记下你的可见度(治判据一)

✅ 给守设衰减闹钟 + 算净惊讶——惊讶有半衰期,别从"埋伏"烂成"失踪";瞄准泄露 > 出击收益时,按住手(治判据二、三)

收口

善猎者善守,不是因为他攻守皆能,也不是因为他无我如水。

是因为他认清:一击的全部威力,买自出击前那段没人察觉的死寂——守是存款,猎是取款,存的是敌人的无知。

对不会学习的世界,他守的是身形——别被看见,然后照着写死的计划,在猎物撞上来时果断收割。
对会学习的对手,他守的是自己的不可预测性——连他自己都说不准下一手,因为任何说得清的规律,都是递给对手的刀。

按住不动,是在攒惊讶;出手,是在花惊讶。守得太久会蒸发成无关,出手太勤会教会对手。

差别只在那一刻:信号来时,你的不动,是在为这一击攒钱——还是你早已被遗忘,攒了一辈子无人会惊讶的惊讶。

(箭到底了。)

追本之箭 — 善猎者善守

追本之箭 — 善猎者善守

起点

第一层:伏击 —— 这一击,在你动之前就已经赢了或输了

第二层:泄露 —— 动一下,就给敌人发了一条情报

第三层:惊讶 —— 那笔存款,单位是 bit

第四层(killer):对称陷阱 —— 存款会蒸发,而瞄准要付费

第五层:两个世界 —— 不会学习的猎物,与会学习的对手

终点:出手前,先认你的猎物会不会学习 + 两张自检

判据零:你的猎物,会不会学习你?(选规矩)

判据一:这一击,还有多少惊讶可花?(估 −log p)

判据二:我的存款,在涨还是在蒸发?(查衰减)

判据三:瞄准的泄露,盖得住出击的收益吗?(算净惊讶)

自检 A:这是"埋伏"还是"失踪 / 过曝"?

自检 B:这一击,净惊讶为正吗?

三个该(把上表翻成动作)

收口

📎 附件

💬 评论