追本之箭 — 热炉冷炉
追本之箭 — 热炉冷炉
2026-05-02 Sat 14:37
起点
"我们应该小心地从经验里只取它本身蕴含的智慧,然后停下——否则我们就会像那只坐过热炉子的猫。她再也不会坐在热炉子上(这是好的),但她也再也不会坐在冷炉子上了。"
——Mark Twain,《Following the Equator》(1897)
朴素读法:别反应过度。 一句劝人放下的常识。
但盯着这只猫看。它学到的规则——"热炉子会烫"——是字面意义上正确的、有用的。
bug 不在它学到了什么。
bug 在它把这条教训钉到了哪个变量上:它怪罪了那个物体(炉子),而真正的凶手是一个属性(热)。
钉错变量,不是因为它笨。是因为——
疼痛只告诉你「出事了」(THAT),从不告诉你「为什么」(WHY)。
WHY 永远是你自己事后补上去的推断。
Mark Twain 说"小心地只取智慧"。他没说的是:你想取走的那份智慧,和你会一起取走的那份创伤,来自同一次推断——而那次推断的输入,根本不足以让你把两者分开。
不是你不够冷静。是信息本身不够。这只箭要钻的,是"不够"这两个字到底有多硬。
第一层 · 归因不定
把一次烫伤当成一道方程来解。
- 输入: 一个标量信号——疼。一个数。
- 想求的: 一个向量——是「热」?是「炉子」?是「厨房」?是「我刚才那个动作」?是「今天是周二」?
一个标量,解不出一个向量。 方程数 < 未知数。
这就是 reinforcement learning 里最古老的硬骨头——信用分配问题(credit assignment problem,Minsky 1961):一个延迟的、笼统的奖惩信号到底该归功/归咎于此前哪一步、哪个特征?系统无从知道。
所以从单次烫伤,无穷多个假设同时拟合这一个数据点:
"炉子危险" / "热的东西危险" / "这个厨房危险" / "周二危险" / "我靠近铁器危险"……
它们对这次经验的解释力完全相同。数据不偏袒任何一个。
猫选了"炉子"。但数据没让它选炉子。数据什么都没让它选。
第二层 · 偏置
替它选的,是先验——learning theory 里叫 inductive bias(归纳偏置)。
这不是某个系统的缺陷,是一条不可绕过的定理:
没有偏置,就没有泛化。
一个对世界不做任何先验假设的学习器,面对欠定的数据,没有任何理性依据去选其中一个假设(Mitchell 1980;No Free Lunch,Wolpert)。
换句话说:"从经验中学习"这件事本身,在逻辑上要求你先带着偏见来。 偏见不是学习的污染,是学习的前提。
那大脑的先验偏向什么?
偏向最省、最显眼的那块。 「炉子」是一个完整、有边界、看得见摸得着的物体(object);「热」是一个抽象的、跨物体的属性(property)。
对一个要在零点几秒内做决定的系统,整块物体比抽象属性便宜得多——更容易编码、更容易调用、更容易在下次"认出来"。
于是猫的先验把疼归给了炉子。不是因为炉子是对的,是因为炉子是便宜的。
salience(显著)≠ causality(因果)。大脑的先验为速度调校,不为准确调校。
第三层 · 代价不对称
它不是 bug。它是最优解。
把决定形式化成期望损失最小化(统计决策论,Wald)。两类错误,两种代价:
- 漏报 L_漏:把热炉当冷炉,坐上去 → 烫伤,甚至死。代价近乎无界。
- 误报 L_误:把冷炉当热炉,不坐 → 损失一点温暖。代价有界、且小。
回避的判据是:
$$P(\text{危险}\mid x)\cdot L_漏 \;>\; P(\text{安全}\mid x)\cdot L_误$$
整理一下,触发回避的似然比阈值:
$$\theta = \frac{P(\text{安全})\cdot L_误}{P(\text{危险})\cdot L_漏}$$
当 $L_漏 \to \infty$(死亡是无界损失)时,$\theta \to 0$:
任何一丝相似,都越过阈值,都该回避。
这正是 Randolph Nesse 的 smoke detector principle(烟雾报警器原理,2001):一个防御系统在代价极度不对称时,就应该被调成频繁误报——宁可一百次假警报,不可漏掉一次真火。烟雾报警器为一根烤糊的吐司尖叫,不是它坏了,是它对了。
也是信号检测论里的 criterion shift(Green & Swets 1966):支付矩阵一旦不对称,最优判别准则就该整体偏移,主动多拒。
所以这只猫,在它的损失函数下,是一个完全正确的贝叶斯决策者。它避开冷炉,给定它的代价权重,是最优的。
第四层 · 两个时钟
那张损失表,不是猫写的。是进化写的。
而进化优化的目标函数,只有一个变量:基因有没有传下去。 在这张表里:
- 死亡 = $-\infty$(基因终结,不可逆,无界损失)。
- 一个没坐的冷炉 = 0。少一点温暖、少一顿热饭、多挨一夜冷——进化的账本上,全部记零。 只要你还能繁殖,这些都不扣分。
于是 $L_漏=\infty,\ L_误=0$。在基因的时钟上,这张表无懈可击。
但你——这只猫,这个人——不活在基因的时钟上。
你活在一个误报会复利的时钟上:每一个冷掉的夜晚、每一顿生的饭、每一段没敢进入的关系、每一次没敢启动的事、每一个绕开的人。这些在你的账本上,$L_误 \ne 0$,而且按天累加。
两个时钟,算的是两笔账。
那个过度回避,对基因是最优,对人生是灾难。
错位就在这里,而且它极其隐蔽:
漏报的代价看得见(烫伤、流血、当场的疼);
误报的代价永远看不见——它以"没发生"的形式存在。你永远不会看到那个本可以温暖你、却被你绕开的冷炉。进化的记账法专门把误报这一栏抹成隐形,因为对基因,它本就是零。
所以问题从来不是"猫学错了"。是:
你在用一台「基因级、保命用」的损失权重,去算一个「人生级、非保命」的决定。
修复的方向因此整个变了——不是"学得更准"(推断没毛病),是"换一张损失表":把那些被进化记成零、其实在你的时钟上天天扣分的误报代价,重新标价。
第五层 · 信念 × 代价
因为知道,和敢做,动的是公式里两个不同的项。
把决定拆开。一个动作的期望损失,是信念乘以代价:
$$\text{该不该避} \;=\; \underbrace{P(\text{危险}\mid x)}_{\text{信念 / belief}} \;\times\; \underbrace{L_漏}_{\text{代价 / loss}}$$
- 知识作用在信念项上。你反复确认"这炉子是冷的",可以把 $P(\text{危险})$ 压到 0.01。
- 但恐惧住在代价项里。$L_漏$ 仍然是那个进化写下的、近乎无穷的数。
于是:
$$0.01 \times \infty \;\;\text{依然}\;>\;\; 0.99 \times (\text{一点温暖})$$
belief 已经几乎确定它安全,decision 还是说别坐。
这就是为什么"我明明知道这不理性"从来治不好一个恐惧症。你把信念项打磨到完美,可决策乘的是另一个项。
那个项怎么改?
论证改不动它。 你可以向自己证明一万遍,$L_漏$ 纹丝不动——因为它当初不是靠论证写进去的,是靠一次真实的疼写进去的。
能重写一个"被感受到的代价"的,只有另一段被感受到的反向经验:身体亲自坐上冷炉,亲自把那个代价重新标一次价(这正是 extinction learning / 暴露疗法的机理——新经验,不是新道理)。
知识更新你的 belief。
只有重新经历,能更新你的 loss。
而 decision 乘的,是 loss。
终点 · 重新定价
钻到底,Mark Twain 这句话的硬核是一行决策代数,加一个出身问题:
$$\text{行为} \;=\; \text{信念}\times\text{代价},\qquad \text{而「代价」这张表,是另一个优化器(进化)为另一个目标(基因)在另一个时钟上写的。}$$
再问"为什么"只会得到:因为理性决策就是期望损失最小化(这是定义,是逻辑地面)+ 因为你的损失权重是继承来的(这是事实,不是错误)。
没有更深了——下面是决策结构本身,和一个你没参与设定的目标函数。
智慧 ≠ "把经验里的好东西挑出来"。
智慧 = 认出你正在用谁的损失表算账,然后给那些被记成零的误报,重新标价。
诊断:把两个项拆开,分别审
每次一段经验让你"从此再也不"时,别审你的反应,审这两栏:
| 审哪个项 | 问自己 | 攻击点 |
|---|---|---|
| 信念 P | 对这个具体情境,真实的 P(出事) 是多少?不是对"这一类"。 | 把抽象类别还原成此刻的概率 |
| 代价 L_漏 | 我把它标成无界,是真无界,还是抄了基因那张"死亡=∞"的表? | 区分真无界 vs 被继承的无界 |
| 代价 L_误(关键) | 回避这件事,每年具体让我损失什么?把那个隐形的零,写成一个数。 | 让看不见的误报代价显形 |
触发器
道理全懂、脚却不动 → 卡住的是 loss 项,不是 belief 项。
→ 论证已经无效(它只够更新 belief)。
→ 唯一能重写 loss 的是反向经验。
→ schedule 一次最小的、可控的再暴露:摸一次冷炉子。让身体亲自重新标价,而不是让脑子再讲一遍道理。
对称陷阱(killer / bear case)
镜像错误同样致命——把 loss 标价到零,大摇大摆走回真正的热炉上。
那个有人会说"不就一个数据点,我不该反应过度"的人,正在把 $L_漏$ 误调成 0。但猫的偏置之所以存在,正因为对真·无界损失的事(真的会死、会破产、会不可逆),过度回避确实是对的。 重新定价,你可能往鲁莽那头算错。
所以收口不是"调低所有代价权重"(那是另一个方向的死)。是:
用你自己时钟上、这件事真实的代价权重,算这一个决定。
判别钥匙——最坏情况,在我的时钟上是有界且可恢复的吗?
- 是 → 基因多收了你的费。误报不是零,你被一张过期的损失表锁住了。重新标价,回去坐。
- 否(真的不可逆、真的无界:死亡、毁灭、烧不灭的火) → 基因是对的,猫是对的。 这里"重新定价"本身才是陷阱。继续避。
热炉冷炉之分,从来不在炉子。
在你账本上那个数,是谁写的、还算不算数。
(箭到底了。)
