追本之箭 — 两个悲剧
追本之箭 — 两个悲剧
2026-05-21 Thu 20:14
起点
"人生有两大悲剧,一是夙愿未果,一是得偿所愿。"
—— 萧伯纳《人与超人》
所有人都把这句话读成两件事:一个坏结局,加另一个坏结局。
然后偷偷松口气:好歹这俩我只会碰上一个——要么没得到,要么得到了。
萧伯纳的狠,不在他列了两个悲剧。
在于这两个悲剧,是同一台机器的两次输出。
把它们叠在一起,会冒出一个反直觉的命题:
你以为你在追的"幸福",根本不是一种你能待在里面的状态。
它是一个事件——一个按定义会结束的事件。
"没得到",是这个事件没发生;"得到了",是这个事件发生完了。
两种,都不是"待在幸福里"。
那真正的问题就不再是"怎么躲开两个悲剧"。
而是:如果幸福压根不是一个能持有的状态,那它到底是什么形状的东西?
第一层 · 一道裂
先把两个悲剧合成一个。
夙愿未果:你和你要的东西之间,有一道缺口。缺口开着,你疼。
得偿所愿:缺口合上的那一瞬,你爽——
然后缺口合上了,那个"合上"的动作结束了,你又什么都感觉不到。
看出来没有:
甜不在"缺口开着",也不在"缺口合着"。
甜在"缺口正在合上"——在那个动词里,不在任何一个名词里。
于是:
- 没得到 = 缺口永远开着 = 疼到底(第一个悲剧)
- 得到了 = 缺口合上、那一下结束 = 平到底(第二个悲剧)
萧伯纳口里的"两个",其实是同一道裂缝的两个时刻:还没合,和合完了。
夹在中间那个"正在合"的瞬间——才是你这辈子真正尝到的甜的全部。
它短得可怜,而且只在变化里存在。
第二层 · 跑步机
下一层,心理学早把这事称过重了。
它叫 hedonic treadmill(享乐跑步机,Brickman & Campbell 1971):
你的幸福有个基准线(set-point)。任何好事把它顶高,
过一阵,基准线自己爬回原处——你又回到起点,只是脚下那条跑带在转。
最硬的证据是那个反直觉到出名的研究——
中头奖的人 vs 出车祸瘫痪的人(Brickman, Coates & Janoff-Bulman 1978):
一年后,两组人的日常幸福度几乎收敛。
中奖的人甚至报告:平常的小乐趣(早餐、闲聊)变得没那么香了——
横财把他们的基准线顶高,日常被相对地拉低了。
这就把第一层钉死了:
你攒不住幸福。
它不是一个余额——你往里存,它就涨。
你存进去的每一笔,都被基准线吃掉。系统只对偏离基准线的量有反应。
幸福是个差值,不是个存量。
第三层 · 误差引擎
再往下,到多巴胺。这里有第一性的硬机制。
直觉以为:多巴胺 = 奖励信号,得到好东西就喷。错。
Schultz, Dayan & Montague(1997) 把猴子的多巴胺神经元记下来,发现它编码的是:
多巴胺 = 奖励预测误差(RPE)= 实际得到 − 事先预期
不是奖励本身,是奖励和预期之间的差。
含义是毁灭性的:
- 一个意外的奖励 → RPE 大 → 多巴胺猛喷(甜)
- 一个预期之内、稳稳到手的奖励 → 实际 = 预期 → RPE = 0 → 多巴胺不动
所以"得偿所愿"的那个平,不是心态问题,是算术:
你追了二十年,早把它预期满了;真到手时,实际 ≈ 预期,误差归零——
引擎对一个它早算准的结果,在化学上是沉默的。
得到那一刻反而空,正因为那一刻的 RPE 最小。
真喷多巴胺的,是没把握、刚刚翻盘的途中——又是"正在合"那一下。
第四层 · 零比特
到这层,框架从生物换成信息。答案不在大脑,在"什么叫信号"。
香农(Shannon)那条铁律:信息 = 意外。一个恒定不变的信号,携带 0 比特。
你盯着一面均匀的白墙看,墙"告诉"你的信息量,是零。
任何高效的感官,都必须把恒定量减掉(韦伯-费希纳定律;efficient coding,Barlow 1961 / Laughlin)——
不减掉,它会被持续刺激烧到饱和,然后对新东西失明。
最狠的实证,就在你眼睛里:Troxler 渐隐(Troxler 1804)+ 稳像实验(Riggs & Ratliff,1950s)——
把一个图像完美固定在视网膜同一片细胞上(用装置抵消掉眼睛的微动),
那图像会在几秒内从你的视野里消失。不是变暗,是没了。
你的眼睛之所以一刻不停地微跳(microsaccade),就是为了不让世界 Troxler 掉。
稳定的输入 = 不存在的输入。 这是感官的物理定律,不是脾气。
幸福系统是同一种器官。
"得偿所愿"就是一个人生目标的 Troxler 渐隐——
你把它牢牢稳在视网膜上(到手、不再变、天天拥有),
于是它从你的意识里淡出,直到你看不见自己正拥有它。
这不是比喻,是同一条原理:对恒定输入,适应到零。
第五层 · 选择压
最后一层,触底。在这儿再问"为什么",只剩同义反复。
设想真有一个物种,对到手的好,感到永久的满足。
会怎样?它会停下来。 满足了就不再觅食、不再竞争、不再去争下一轮繁殖。
在它旁边,另一个物种到手就归零、立刻又饿——
两个摆一起跑,永远饿的那个,把永远满足的那个,挤死了。
所以"基准线归零"不是 bug,是被选择压筛出来的特性。
更深一层,逻辑本身就堵死了另一条路:
适应度(fitness)本身就是个差值——你不需要"过得好",你需要"比对手过得更好"。
更,是个比较,是个 Δ,不是个状态。
抽到顶:
任何必须在开放环境里持续行动的 agent,
若它的奖励函数定义在"状态"上 → 一旦抵达最优状态就停机 → 停机者出局。
要让 agent 永远动下去,它的奖励必须定义在"状态的转移"上,绝不在状态本身。
到这儿,"为什么得到了会空"已经化简成:
因为一个不会空的满足,会让你停;而停下来的东西,留不下来。
再问下去,就是循环论证了。箭碰到底了。
幸福被造成一个导数(dV/dt),不是一个水平(V)——
不是设计失误,是"任何停不下来的系统"的必要条件。
终点:把幸福当流量,不当存量
钻到底,这句话给的不是安慰,是一套工程约束。
先认一个对称陷阱(killer)
知道"幸福在变化里"之后,最蠢的反应是:那我就不停换新的。
换工作、换城市、换对象、换目标——
这恰好是把跑步机调到最快档。 多巴胺靠新鲜度续命,
而新鲜度的边际急速衰减,你得越换越猛,最后是 novelty 上瘾 / 烧穿(这正是成瘾的回路)。
于是两头都是死:
- 把好东西冻成稳定状态 → Troxler 渐隐,平到底。
- 不停换新对象去追变化 → 跑步机全速,烧穿。
真正的出口在第三条:
不换对象,而是从同一个对象里,重新制造误差。
同一本书重读,读出上次没看见的结构 → 真实的 RPE,来自深度,不是来自换书。
同一个人,理解深一层 → 缺口在原地重新打开。
深度,是唯一不靠"换"来续命的变化源。
诊断表
| 你脑里的念头 | 底层把幸福当成 | 它会怎么死 |
|---|---|---|
| "等我拿到 X 就好了" | 存量(到了就存住) | RPE 归零,到手即平 |
| "我得不停搞新花样才不无聊" | 导数,但靠换对象 | 跑步机全速,边际烧穿 |
| "我拥有的这些,怎么没感觉了" | 存量被 Troxler 掉了 | 稳定输入 = 看不见 |
| "这事我重做一遍还能挖出新东西" | 导数,靠深度供给 | 不死(可持续) |
三个触发器(抓现行)
① 听见自己说"等到……就"——警报:你在把幸福当存量,它到手会归零。
② 又想换一个新的(新项目 / 新关系 / 新城市)——先问:是这对象真耗尽了,还是我只是在喂跑步机?
③ 对手里长期拥有的东西麻木了——这不是它变差,是 Troxler 渐隐;制造对比(断一阵、换视角、往深里挖),让它重新可见。
重新归零的两个真动作
- 断供再恢复(resensitization): 主动离开那个好东西一阵(斋戒、留白),基准线降回来,再接触时它重新发光。差值是可以制造的。
- 往深里挖,不往外面换: 在同一个标的上找新结构。深度产生的误差不付 Troxler 的租金——标的没变,变的是你看它的分辨率。
最后一句
萧伯纳没说人生只能是悲剧。
他说的是:只要你把幸福当成一个能到达、能持有的状态,你就锁死在两个悲剧里——
没到达,疼;到达了,平。
出口不是"别再要"(那是禁欲,做不到也不必),
是认清幸福的形状:它是流量,不是存量;是导数,不是水平;
只在变化里存在,而最不耗的变化源,是深度,不是新鲜。
别去攒一个永远到不了的"够了"。
去当那个一直在产生变化的源头。
源头不会 Troxler 掉——因为它从不静止。
(箭到底了。)
