追本之箭 — 重复
追本之箭 — 重复
2026-05-17 Sat 17:24
起点
"没有天赋,那就重复。"
通行的读法:这是 Plan B。
正门(天赋)进不去,走侧门(苦练)。一句留给普通人的安慰。
但这句话身上压着一个没人检查的前提——
天赋和重复,是两种东西。
往下钻,这个前提会碎:
天赋不是重复的对立面。
天赋是已经完成的重复——发生在你出生之前、你看不见的车间里。
所以这句话不是退路。
它把宇宙里唯一存在的 Plan A,说了出来。
命门只有一个:既然只有这一个算法,它为什么看起来这么笨——为什么大多数人的重复,一无所获?
第一层 · 名词病
"天赋"是个名词。
名词暗示实体:一个你有、或没有的东西。
但去现场,从来找不到这个实体。只能找到时间线。
莫扎特,"天赋"的代言人:
父亲 Leopold 是职业小提琴教育家,1756 年(沃尔夫冈出生那年)出版了当世标准的小提琴教程;儿子从 3 岁起接受全职定向训练。
你看到的,是 6 岁神童巡演——
你没看到的,是 0 到 6 岁那间不对外开放的车间。
"天赋"这个词的真实功能不是描述,是社会分工:
| 谁在用 | 用来做什么 |
|---|---|
| 观众 | 免除自己:"他是天才,所以我不必练" |
| 既得者 | 加冕自己:"我是天选,不是堆出来的" |
把不可见的重复,打包成可见的魔法——这就是名词病:
先把过程冻结成实体,再对实体顶礼膜拜。
第二层 · 假重复
先让 killer 上桌,不藏。
Mosing 等 2014(Psychological Science,万余对瑞典双生子):
同卵双生子里练琴更多的那个,音高/旋律/节奏分辨并不更强;
练习量本身,遗传率约 40–70%——连"肯练"都有一半写在基因里。
在刻意练习的旗舰领域,"重复次数 → 能力"的因果,被打穿了一个洞。
这个洞逼出本层的发现:"重复"这个词,混淆了两种东西。
| 死重复 | 活重复 | |
|---|---|---|
| 动作 | 复制上一次 | 每次改一个变量 |
| 反馈 | 无 / 迟钝 | 即时误差信号 |
| 难度 | 舒适区内 | 刚好够不着 |
| 产物 | 给旧回路上釉 | 改写回路 |
证据全堆在死重复一侧:
十年驾龄不比一年强;执业年限更长的医生,诊疗质量不升反降(Choudhry 2005 系统综述)。
一旦动作自动化,重复只是在已有的错误上抛光。
活重复的配方早被写出来(Ericsson 1993 刻意练习;Bjork: desirable difficulties):
学习量 = 次数 × 变异幅度 × 反馈精度
乘法,不是加法。任何一项归零,乘积归零。
死重复 = 变异≈0、反馈≈0 的重复——次数再大,依然是零。
Mosing 的洞也有了去向:问卷统计的是小时数(次数),没测变异与反馈(另两个因子)。
而基因真正改变的,是这两个因子的价格——
有人天生反馈环短(听错一个音,生理性难受),变异对他更便宜。
天赋买不到学习。天赋买的是学习的折扣价。
第三层 · 噪声
切换语言:把学技能写成优化问题——在一张高维、坑坑洼洼的误差曲面上,找最深的谷。
两个反直觉的硬结果:
① SGD 赢在"不准"。
全量梯度下降,每步都走"最正确"的方向——然后卡死在遇到的第一个浅坑里。
随机梯度下降,每步只看一小撮样本,方向带噪声——
正是这股抖动,把搜索从浅坑里震出来,落进更深、更平的谷。
机器学习四十年的核心教训:噪声不是学习的代价,是学习的引擎。
② 退火赢在"慢"。
模拟退火(Kirkpatrick 1983, Science):高温乱跳 → 缓慢降温 → 晶体落入全局最优。
降温太快,叫淬火——缺陷被原地冻进晶格。
淬火,就是死重复的物理学名字:过早自动化,把错误锻进回路。
用这套语言重写前两层:
天赋 = 好的初始化(出生即站在离谷不远的坡上)
重复 = 步数 × 噪声(变异) × 梯度(反馈)
而非凸曲面上的通则:
初始化的优势随步数衰减,步数的优势随时间累积。
第四层 · 老算法
没人设计它。它是唯一能自举的算法。
进化 = 复制(重复)+ 突变(变异)+ 选择(反馈)。
同一个三因子乘法,40 亿年,无设计者——
产出眼睛、翅膀、免疫系统、大脑。
宇宙里每一个复杂适应结构,无一例外,全是这个循环堆出来的。
包括"天赋"本身。
你的音准、反应速度、多巴胺曲线——
是祖先在这个循环里跑了 40 亿年的存档文件。
第一层的怀疑在这里坐实:
天赋 = 冻结的重复(写进基因的迭代缓存)
重复 = 解冻的天赋(同一算法,在你这条命里继续跑)
"没有天赋,那就重复"——原来是同义语的两半:
没有预存的迭代,那就现场迭代。
物理还补了一刀,解释为什么禁止一步到位:
热力学第二定律——低熵的精密结构不能凭空跳出,
只能靠开放系统持续付能量、一小步一小步逆流堆起(Prigogine: 耗散结构)。
一步登天,在热力学上是违章建筑。
第五层 · 归纳
不保证。脚下就是最后的地面。
No Free Lunch 定理(Wolpert & Macready 1997):
对所有可能的问题取平均,任何算法都不比瞎猜更好。
重复(试错迭代)并非在一切世界有效——
它只在有结构的世界有效:曲面要有坡,昨天的纠错对今天才算数。
所以"为什么重复有效",追到底,等价于"为什么归纳有效"——
Hume 的老问题。无法证明,只能下注。
世界若是纯噪声(轮盘赌)——重复一万次,期望仍是零。
世界若有规律——重复是唯一能读出规律的仪器;
天赋读不出任何新东西,天赋只是上一轮读数的缓存。
再往下问"凭什么世界有规律",只剩同义反复:
有规律的世界,才养得出问这个问题的我们。
到底了。 这句话的最终形态:
"没有天赋,那就重复"
= "没有缓存,那就现场计算"
= 对"世界有规律"下注。
这注没有担保。但它是桌上唯一的注——
进化已经连押了 40 亿年,你的存在就是赔付记录。
终点 · 把重复造成机器
别再问"我有没有天赋"——那是在盘点缓存。
问:我的重复,三个因子都大于零吗?
设计步骤:重复机器三件套
① 变异源——每次重复改一个变量(速度/约束/顺序/工具)。自检:这次和上次差在哪?答不出 = 死重复。
② 反馈环——误差多久可见?反馈环超过 24 小时的,先压缩反馈,再谈次数。
③ 降温计划——早期高温(允许大错、广探索),后期降温(收紧、固化)。顺序倒了 = 淬火,把错误锻进去。
诊断表
| 症状 | 诊断 | 校正 |
|---|---|---|
| 次数巨大,水平十年不动 | 死重复:自动化上釉 | 注入变异:换约束、提速、限时 |
| 一练就舒服 | 难度因子归零 | 调到刚够不着——约 85% 成功率最优(Wilson 2019) |
| 越练,越熟练地错 | 反馈环断裂 | 停止加次数,先修误差信号 |
| 怎么练,结果都随机 | 域无结构(NFL 域:彩票、纯噪声) | 撤出——这里重复期望为零 |
| "他有天赋,我不练了" | 名词病发作 | 名词换回动词:他只是重复在先 |
三个触发器
- 进场前:这个域有坡吗——昨天的纠错,明天还算数吗?没有 → 不进。
- 每次重复后:和上一次差在哪?连续十次答不出 → 重造变异源。
- 平台期:反馈环还在吐新的误差信息 → 继续;误差信息归零 → 不是该更努力,是该换变异维度。
最后一句
天赋是名词,重复是动词——
而宇宙里从来没有名词,
只有跑得足够久、被人截屏的动词。
(箭到底了。)
