追本之箭 — 热炉冷炉

2026-05-02 · 5 层下钻

追本之箭 — 热炉冷炉

2026-05-02 Sat 14:37

起点

"我们应该小心地从经验里只取它本身蕴含的智慧,然后停下——否则我们就会像那只坐过热炉子的猫。她再也不会坐在热炉子上(这是好的),但她也再也不会坐在冷炉子上了。"

——Mark Twain,《Following the Equator》(1897)

朴素读法:别反应过度。 一句劝人放下的常识。

但盯着这只猫看。它学到的规则——"热炉子会烫"——是字面意义上正确的、有用的。

bug 不在它学到了什么。

bug 在它把这条教训钉到了哪个变量上:它怪罪了那个物体(炉子),而真正的凶手是一个属性(热)。

钉错变量,不是因为它笨。是因为——

疼痛只告诉你「出事了」(THAT),从不告诉你「为什么」(WHY)。

WHY 永远是你自己事后补上去的推断。

Mark Twain 说"小心地只取智慧"。他没说的是:你想取走的那份智慧,和你会一起取走的那份创伤,来自同一次推断——而那次推断的输入,根本不足以让你把两者分开。

不是你不够冷静。是信息本身不够。这只箭要钻的,是"不够"这两个字到底有多硬。

第一层 · 归因不定

把一次烫伤当成一道方程来解。

输入: 一个标量信号——疼。一个数。
想求的: 一个向量——是「热」?是「炉子」?是「厨房」?是「我刚才那个动作」?是「今天是周二」?

一个标量,解不出一个向量。 方程数 < 未知数。

这就是 reinforcement learning 里最古老的硬骨头——信用分配问题(credit assignment problem,Minsky 1961):一个延迟的、笼统的奖惩信号到底该归功/归咎于此前哪一步、哪个特征?系统无从知道。

所以从单次烫伤,无穷多个假设同时拟合这一个数据点:

"炉子危险" / "热的东西危险" / "这个厨房危险" / "周二危险" / "我靠近铁器危险"……

它们对这次经验的解释力完全相同。数据不偏袒任何一个。

猫选了"炉子"。但数据没让它选炉子。数据什么都没让它选。

裂缝：既然数据本身定不下来选哪个假设——那是「谁」替它选的?选择一定发生在数据到达之前。

第二层 · 偏置

替它选的,是先验——learning theory 里叫 inductive bias(归纳偏置)。

这不是某个系统的缺陷,是一条不可绕过的定理:

没有偏置,就没有泛化。

一个对世界不做任何先验假设的学习器,面对欠定的数据,没有任何理性依据去选其中一个假设(Mitchell 1980;No Free Lunch,Wolpert)。

换句话说:"从经验中学习"这件事本身,在逻辑上要求你先带着偏见来。 偏见不是学习的污染,是学习的前提。

那大脑的先验偏向什么?

偏向最省、最显眼的那块。 「炉子」是一个完整、有边界、看得见摸得着的物体(object);「热」是一个抽象的、跨物体的属性(property)。

对一个要在零点几秒内做决定的系统,整块物体比抽象属性便宜得多——更容易编码、更容易调用、更容易在下次"认出来"。

于是猫的先验把疼归给了炉子。不是因为炉子是对的,是因为炉子是便宜的。

salience(显著)≠ causality(因果)。大脑的先验为速度调校,不为准确调校。

裂缝：可这条先验"宁可错怪一整类物体"——这种系统性的过度回避,听上去就是个 bug。它是被进化将就着留下的劣化,还是……它其实是对的?

第三层 · 代价不对称

它不是 bug。它是最优解。

把决定形式化成期望损失最小化(统计决策论,Wald)。两类错误,两种代价:

漏报 L_漏:把热炉当冷炉,坐上去 → 烫伤,甚至死。代价近乎无界。
误报 L_误:把冷炉当热炉,不坐 → 损失一点温暖。代价有界、且小。

回避的判据是:

$$P(\text{危险}\mid x)\cdot L_漏 \;>\; P(\text{安全}\mid x)\cdot L_误$$

整理一下,触发回避的似然比阈值:

$$\theta = \frac{P(\text{安全})\cdot L_误}{P(\text{危险})\cdot L_漏}$$

当 $L_漏 \to \infty$(死亡是无界损失)时,$\theta \to 0$:

任何一丝相似,都越过阈值,都该回避。

这正是 Randolph Nesse 的 smoke detector principle(烟雾报警器原理,2001):一个防御系统在代价极度不对称时,就应该被调成频繁误报——宁可一百次假警报,不可漏掉一次真火。烟雾报警器为一根烤糊的吐司尖叫,不是它坏了,是它对了。

也是信号检测论里的 criterion shift(Green & Swets 1966):支付矩阵一旦不对称,最优判别准则就该整体偏移,主动多拒。

所以这只猫,在它的损失函数下,是一个完全正确的贝叶斯决策者。它避开冷炉,给定它的代价权重,是最优的。

裂缝：如果过度回避是 Bayes 最优——那猫根本没算错。Mark Twain 凭什么说它有问题?错,既然不在推断里,就只能藏在那张损失函数里。那张 $L_漏=\infty$ 的表,是谁写的?为谁写的?

第四层 · 两个时钟

那张损失表,不是猫写的。是进化写的。

而进化优化的目标函数,只有一个变量:基因有没有传下去。 在这张表里:

死亡 = $-\infty$(基因终结,不可逆,无界损失)。
一个没坐的冷炉 = 0。少一点温暖、少一顿热饭、多挨一夜冷——进化的账本上,全部记零。 只要你还能繁殖,这些都不扣分。

于是 $L_漏=\infty,\ L_误=0$。在基因的时钟上,这张表无懈可击。

但你——这只猫,这个人——不活在基因的时钟上。

你活在一个误报会复利的时钟上:每一个冷掉的夜晚、每一顿生的饭、每一段没敢进入的关系、每一次没敢启动的事、每一个绕开的人。这些在你的账本上,$L_误 \ne 0$,而且按天累加。

两个时钟,算的是两笔账。

那个过度回避,对基因是最优,对人生是灾难。

错位就在这里,而且它极其隐蔽:

漏报的代价看得见(烫伤、流血、当场的疼);

误报的代价永远看不见——它以"没发生"的形式存在。你永远不会看到那个本可以温暖你、却被你绕开的冷炉。进化的记账法专门把误报这一栏抹成隐形,因为对基因,它本就是零。

所以问题从来不是"猫学错了"。是:

你在用一台「基因级、保命用」的损失权重,去算一个「人生级、非保命」的决定。

修复的方向因此整个变了——不是"学得更准"(推断没毛病),是"换一张损失表":把那些被进化记成零、其实在你的时钟上天天扣分的误报代价,重新标价。

裂缝：好。我现在知道了——这张表是基因写的,冷炉对我不是零。那我直接拿这个认知改判据不就行了?可为什么……道理全懂,我的脚还是不肯坐上那个冷炉?

第五层 · 信念 × 代价

因为知道,和敢做,动的是公式里两个不同的项。

把决定拆开。一个动作的期望损失,是信念乘以代价:

$$\text{该不该避} \;=\; \underbrace{P(\text{危险}\mid x)}_{\text{信念 / belief}} \;\times\; \underbrace{L_漏}_{\text{代价 / loss}}$$

知识作用在信念项上。你反复确认"这炉子是冷的",可以把 $P(\text{危险})$ 压到 0.01。
但恐惧住在代价项里。$L_漏$ 仍然是那个进化写下的、近乎无穷的数。

于是:

$$0.01 \times \infty \;\;\text{依然}\;>\;\; 0.99 \times (\text{一点温暖})$$

belief 已经几乎确定它安全,decision 还是说别坐。

这就是为什么"我明明知道这不理性"从来治不好一个恐惧症。你把信念项打磨到完美,可决策乘的是另一个项。

那个项怎么改?

论证改不动它。 你可以向自己证明一万遍,$L_漏$ 纹丝不动——因为它当初不是靠论证写进去的,是靠一次真实的疼写进去的。

能重写一个"被感受到的代价"的,只有另一段被感受到的反向经验:身体亲自坐上冷炉,亲自把那个代价重新标一次价(这正是 extinction learning / 暴露疗法的机理——新经验,不是新道理)。

知识更新你的 belief。

只有重新经历,能更新你的 loss。

而 decision 乘的,是 loss。

裂缝：再问一层为什么——为什么 decision 一定等于 belief × loss?……到这儿,只剩同义反复了。

终点 · 重新定价

钻到底,Mark Twain 这句话的硬核是一行决策代数,加一个出身问题:

$$\text{行为} \;=\; \text{信念}\times\text{代价},\qquad \text{而「代价」这张表,是另一个优化器(进化)为另一个目标(基因)在另一个时钟上写的。}$$

再问"为什么"只会得到:因为理性决策就是期望损失最小化(这是定义,是逻辑地面)+ 因为你的损失权重是继承来的(这是事实,不是错误)。

没有更深了——下面是决策结构本身,和一个你没参与设定的目标函数。

智慧 ≠ "把经验里的好东西挑出来"。

智慧 = 认出你正在用谁的损失表算账,然后给那些被记成零的误报,重新标价。

诊断:把两个项拆开,分别审

每次一段经验让你"从此再也不"时,别审你的反应,审这两栏:

审哪个项	问自己	攻击点
信念 P	对这个具体情境,真实的 P(出事) 是多少?不是对"这一类"。	把抽象类别还原成此刻的概率
代价 L_漏	我把它标成无界,是真无界,还是抄了基因那张"死亡=∞"的表?	区分真无界 vs 被继承的无界
代价 L_误(关键)	回避这件事,每年具体让我损失什么?把那个隐形的零,写成一个数。	让看不见的误报代价显形

触发器

道理全懂、脚却不动 → 卡住的是 loss 项,不是 belief 项。

→ 论证已经无效(它只够更新 belief)。

→ 唯一能重写 loss 的是反向经验。

→ schedule 一次最小的、可控的再暴露:摸一次冷炉子。让身体亲自重新标价,而不是让脑子再讲一遍道理。

对称陷阱(killer / bear case)

镜像错误同样致命——把 loss 标价到零,大摇大摆走回真正的热炉上。

那个有人会说"不就一个数据点,我不该反应过度"的人,正在把 $L_漏$ 误调成 0。但猫的偏置之所以存在,正因为对真·无界损失的事(真的会死、会破产、会不可逆),过度回避确实是对的。 重新定价,你可能往鲁莽那头算错。

所以收口不是"调低所有代价权重"(那是另一个方向的死)。是:

用你自己时钟上、这件事真实的代价权重,算这一个决定。

判别钥匙——最坏情况,在我的时钟上是有界且可恢复的吗?

是 → 基因多收了你的费。误报不是零,你被一张过期的损失表锁住了。重新标价,回去坐。
否(真的不可逆、真的无界:死亡、毁灭、烧不灭的火) → 基因是对的,猫是对的。 这里"重新定价"本身才是陷阱。继续避。

热炉冷炉之分,从来不在炉子。

在你账本上那个数,是谁写的、还算不算数。

(箭到底了。)

追本之箭 — 热炉冷炉

追本之箭 — 热炉冷炉

起点

第一层 · 归因不定

第二层 · 偏置

第三层 · 代价不对称

第四层 · 两个时钟

第五层 · 信念 × 代价

终点 · 重新定价

诊断:把两个项拆开,分别审

触发器

对称陷阱(killer / bear case)

📎 附件

💬 评论