追本之箭 — 优秀是卓越的敌人
追本之箭 — 优秀是卓越的敌人
2026-04-29 Wed 12:59
起点
"Good is the enemy of great."
优秀是卓越的敌人。
——Jim Collins,《Good to Great》(2001) 开篇第一句
朴素的读法,把这句话当励志:优秀是台阶,你再蹬一脚就上卓越。
这读法把"敌人"两个字读没了。敌人不是台阶。敌人是主动挡路、抢你资源、跟你争同一块地盘的东西。
精确的版本狠得多:
卓越不在优秀的"前方"。它在优秀的"下方,先经过一段更差"。
因为优秀是一座山顶。而站在山顶上,每一个方向都是下坡。
你越优秀,这山头越高;山头越高,四周的谷越深;谷越深,迈出去的第一步——往卓越走的那一步——就越是一个"明摆着的退步"。
所以优秀不是中性的起点。它是一堵墙。而且你越成功,这堵墙越高。
命门就在这里:既然通往卓越的第一步是变差,那——什么样的地形里,这堵墙翻得过去、值得翻?什么样的地形里,翻墙只是自毁,"守住优秀"才是对的?这句话到底是解药,还是毒药?
第一层 · 峰即墙
把一个人的能力放进一张地图:横轴是"你怎么做事",纵轴是"做得多好"。你毕生在这张图上找高处。
你用的找法,是爬坡(hill climbing):试一个微调,变好就留下,变差就退回。多做奏效的,少做不奏效的。这是几乎一切"努力变好"的底层算法。
爬坡有一个数学上铁定的命运:它停在最近的山顶,然后再也不动。
因为山顶的定义就是——四周每一步都往下。微调全都变差,算法判定"到顶了",收工。
这个山顶有个名字:局部最优(local optimum)。它不保证是全图最高,只保证是你脚下这一带最高。
"优秀"就是一个相当高的局部最优。
反直觉的一刀在这里:
你越优秀(局部峰越高),爬坡算法越是把你锁死在原地。
因为峰越高,离开它的每一步跌得越狠;跌得越狠,"变好就留、变差就退"这条规则,越坚决地把你弹回峰顶。
优秀不是被动地"还不够卓越"。它在用你自己的趋利避害,主动地把你焊在这里。这才配叫敌人。
第二层 · 谷的算术
看得见,过不去,因为中间隔着一条谷。翻过去要先主动变差,而且不知道能不能到对面。
把"要不要翻"写成一道期望值的账:
- 留在峰顶:确定的、当下的、丰厚的收益。
- 跳下谷去够更高峰:确定的当下损失(谷底) + 不确定的、延迟的、要打折的未来收益。
谁的账最算不过来?恰恰是最优秀的人。
因为他峰顶越高,跳下去那段"确定损失"越大——他有最多可输的东西。穷光蛋试错没成本;成功者试错,赌上的是全部。
这不是性格保守,是算出来的保守:优秀者的试错机会成本,是全场最高的。地形逼他选"守"。
这条机制有个正式名字,在公司层面被反复验证——创新者的窘境(Clayton Christensen,《The Innovator's Dilemma》1997):在位巨头不是看不见颠覆性技术,是它现有的好生意,让那个低利润、小市场的颠覆赌注在财务上算不过来。于是它"理性地"放弃,然后被那个赌注杀死。
优秀越扎实,跳谷的账越亏。
"守住优秀"在每一个当下都是局部最优的决策——这正是陷阱锁得最死的地方:它不要你犯任何错,只要你每一步都对。
第三层 · 模型消音
是的。优秀不止抬高成本,它重写你的感知。
要变优秀,你得在脑子里建一个预测模型:这个领域里,什么有用、什么没用、什么是信号、什么是噪声。模型越准,你越优秀。
可模型的本质是压缩——它靠丢弃"无关信息"来高效预测。而它判定为"无关"、第一个丢掉的,恰恰是异常值(outlier)。
卓越,几乎总是从一个异常值里长出来的。
于是:
你的模型越好,先验越强;先验越强,它越是自动、无声地,把那个"不合模型的怪信号"解释成噪声、抹掉。
这不是偶然的盲,是训练出来的盲——你的模型的本职工作,就是压制卓越藏身的那片噪声。
心理学有硬实证:Einstellung 效应(Luchins 量水罐实验,1942)——人一旦掌握一个奏效的解法,面对本可以用更简单办法解决的新问题,会看不见那个更优解,固执套用旧解。专家比新手更容易栽,因为专家的"set"更硬。
底下还有一层更一般的结构——explore / exploit 权衡(multi-armed bandit):
- 优秀 = 纯 exploit。把算力全压在"已知最优的那只手臂"上。
- 卓越 = 必须先 explore。去拉那些"看起来更差"的手臂,才可能撞见一只回报更高的。
一旦你足够优秀,exploit 的即时回报压倒一切,explore 的预算被压到零。你不是不想探索,是你整个系统已经调成了零探索。
优秀让你算不过账(第二层),更让你根本看不见账面之外的选项(第三层)。
墙不只在脚下,还在你眼睛里。
第四层 · 对称之毒(killer)
这是最致命的一击,而且它先砍向 Collins 自己。
幸存者偏差:《Good to Great》挑了 11 家"卓越"公司当样本。后来呢?Circuit City 在 2008 金融危机中破产清算;Fannie Mae 2008 年被政府接管(conservatorship)。事后看,当年的"卓越",有相当一部分是运气 + 均值回归,不是可复制的更高峰。从结果倒着挑出走得最高的那几条随机游走,再给它们编一套必然性——这本身就是幸存者偏差的教科书演示。
把这一刀推到底:
"优秀是卓越的敌人"成立,当且仅当地形满足三个条件——
① 多峰:真的存在一个更高的局部最优(地形是 rugged 的,不是单峰)。
② 可渡:你能在谷底活下来(runway 够,不会跌死在半路)。
③ 够得着:那个更高峰在你能力的搜索半径内,不是海市蜃楼。
三个条件,缺一个,这句话就反转成毒药。
因为它只攻击一侧的错误("守在优秀=怂"),却对对称的另一侧错误只字不提:
在一座单峰地形上,你已经站在全局最高点。
这时"放弃优秀去追卓越"不是勇敢,是把全局最优,换成一个谷底里的幻觉。
大多数"裸辞追梦"的人没找到更高峰——他们跌进谷里,死在那儿,再没爬回原来的高度。
两个方向是对称的死法:
- 该翻墙时守着峰顶 = 被局部最优套牢(Collins 骂的那种)。
- 没有更高峰时硬跳下谷 = 自毁(Collins 这句话怂恿出来的那种)。
而你事前几乎无法分辨自己站在哪种地形上——这触到了优化理论的硬底:No Free Lunch 定理(Wolpert & Macready,1997)。它的冷酷推论是:不存在任何"只靠局部信息"的算法,能跨所有地形保证找到全局最优。要么你付出探索(亲自跳谷去验地形),要么你先验地知道地形长什么样。没有第三条路。没有免费的午餐。
所以判据从来不是"我够不够有追求卓越的决心"(那是在问德性)。
是两问叠加:我脚下是局部峰,还是全局峰? × 这条谷,我渡得过去吗?
终点 · 先看地形
钻到底,这句话把你该问的问题,整个换掉了。
不是"我是不是在优秀里苟着?"(德性的问法,引你去翻每一堵墙)。
是"我脚下这片地形,长什么样?我在它的哪个位置?"
再往下追问"为什么优秀是卓越的敌人",只剩同义反复:因为要到更高的峰,必须先离开当前的峰;而离开一个峰,定义上就是往下走。 这已经不是关于人的话,是极值点的几何。箭碰到地了。
定位三问
① 地形:rugged 还是 smooth?
找一个存在性证明:你这行里,有没有人从一个"更差的起点",跳到了你现在够不着的高度?
有 → 多峰,墙后面真有东西。没有(且你已在前列) → 你可能就站在全局峰上,别瞎跳。
② 谷深:你渡得过去吗?
离开优秀,要先损失多少?谷底能活多久(runway)?
活不下来 → 不管有没有更高峰,都别跳。死在谷底 = 0,守住峰顶才是对的。这不是怂,是算术。
③ 信号:你还在探索吗?
你上一次认真对待一个"不合你模型的异常",是什么时候?
想不起来 → 你的模型在帮你消音,你是纯 exploit。哪怕地形多峰,你也永远撞不到那堵墙。
诊断表
| 你以为你在 | 真实地形 | 它其实是 |
|---|---|---|
| "守住优秀,稳" | 多峰、谷可渡、更高峰存在 | 被局部最优套牢(Collins 骂得对) |
| "放弃优秀去追卓越" | 单峰、你已在顶 | 自毁(把全局最优换成幻觉) |
| "我一直在探索卓越" | 几年没碰过一个反模型的异常 | 伪探索,纯 exploit 穿了探索的外衣 |
| "够不上,认命优秀" | 谷底活不下来 | 理性(留在峰上是对的,不是认输) |
翻墙的唯一已知办法
爬坡跳不出局部最优。工程上真正管用的逃逸法,叫 simulated annealing(模拟退火):以一定概率,接受"变差"的一步,而且早期接受得多、后期收紧。
翻成人话:
✅ 想去更高峰 → 你必须主动、有预算地容忍一段变差;指望"只往上、绝不往下"走到卓越,数学上不可能。
✅ 但要控温:容忍变差是有概率、有时限、有 runway 上限的实验,不是把房子烧了梭哈。
✅ 跳之前先做存在性证明 + 算谷深;两样缺一,退火就退成了纯粹的自焚。
最后一句
优秀是卓越的敌人——只在一种地形上成立:你脚下是局部峰,谷渡得过,更高峰真的在。
三个条件缺一,这句话就从解药翻成毒药:它怂恿你跳下你本该死守的全局最优。
所以沉住气之前,先别问"我够不够有野心"。
先看清脚下:你站的,是一座该离开的小山头,还是一座该守住的最高峰?
看不出地形,谈什么决心,都是在拿命猜。
(箭到底了。)
