追本之箭 — 数字与物理
追本之箭 — 数字与物理
2026-05-09 Sat 14:26
起点
"低估算力需求,是科技史上最稳定的错误。
1943 年有人说全球大概只需要五台计算机。比尔盖茨当年都低估过,说 640KB 内存应该够每个人用,不需要更多了。
数字世界和物理世界的迭代规律和速度不一样,人类生活在物理世界,AI 生活在数字世界,两种不同的物种,不要拿物理世界的发动机和小车去想象数字世界的发展轨迹。"
先拆掉一个舒服的读法:"古人短视,我们引以为戒。"
不对。这个错误可怕在——犯错的方法是对的。
外推法是物理世界的最佳实践:工程师拿"按当前参数外推"造了一百年的桥、电网、客机,几乎不出错。1943 年估计算机需求的人,用的正是这套久经考验的方法。
同一把尺子,量物理世界是科学,量数字世界是八十年连续被打脸。
所以这不是"人蠢"的故事——蠢会被淘汰,这个错误却稳定复发,每代都由当时最聪明的人重犯一遍。一个学不会的错误,不是知识缺口,是结构。
顺带验一下案底:那两个段子本身都查无实据——"五台计算机"找不到任何原始记录,Gates 本人公开否认说过 640KB。但有据可查的同款管够:Krugman 1998 年白纸黑字写"到 2005 年左右,互联网对经济的影响不会超过传真机"(Red Herring, 1998)。段子可疑,模式坐实。
这支箭不射预测者——他们的大脑哪里坏了,是另一题。这支箭射世界本身:
两个世界到底差了什么,让同一把尺子在一边是真理,在另一边是系统性失明?
第一层 · 价格
"五台计算机"的算术没有任何毛病。
需求 = 当前用途 × 当前价格下愿意掏钱的人。1943 年,一次计算的价格是一个房间、几吨设备、一队工程师。这个价格下,地球上确实只有几十个买家。
错误藏在一个没人写出来的假设里:价格是常数。
物理世界,这个假设近似成立——成本的地板是原材料加能量,这部分压不掉,所以物理商品的降价会饱和:电力、钢铁在二十世纪上半叶暴跌之后就趴平了。
数字世界,这个假设是病句。Nordhaus(2007)测算:两个世纪间单位计算成本掉了超过十个数量级。
而价格每掉一个数量级,你就滑进需求曲线上从未有人见过的区段:
| 计算的价格 | 解锁的买家 |
|---|---|
| 一间房 | 政府、军队 |
| 一辆车 | 企业 |
| 一个月薪 | 家庭 |
| 一杯咖啡 | 口袋 |
| 约等于零 | 冰箱、灯泡、每一行日志 |
这不是新现象。Jevons 1865 年在《The Coal Question》里就指出:瓦特把蒸汽机效率提上去,英国煤耗不降反暴涨——当需求的价格弹性大于一,降价不省钱,降价造需求。
算力八十年一直泡在 Jevons 区间里。
所以"够用"在数字世界是语法错误:"够"是对固定需求说的,而数字需求是价格的函数,价格在塌缩。每个预测者都拿"当前用途清单"估需求——可清单本身就是当前价格的产物。价格一变,清单作废。
第二层 · 世代
迭代速度不是玄学,可以拆:
改进速度 = (1 + ε)^n —— ε 是每代挤出的改进,n 是单位时间的世代数。
两个世界的 ε 差不多:好工程师在哪儿都是每代抠几个百分点。差的是 n。
| 一代 = | 周期 | |
|---|---|---|
| 物理 | 设计→开模→制造→运输→装机→现场反馈 | 月到年(汽车改款 3-5 年,客机一代 15 年) |
| 数字 | 编辑→编译→部署→遥测 | 分钟到天 |
n 差 10³~10⁵。差在指数位上,不在系数位上——这就是"不要拿发动机和小车去想象"的数学内容:不是数字比物理快几倍,是两条曲线不同阶。
还有第二台发动机:改进的继承方式。
物理的改进只活在新出厂的个体里,存量要等折旧换代——美国汽车平均车龄十二年上下,一个发动机改进要十几年才渗透完整个车队。
数字的改进靠复制继承:一次 update,十亿个实例同时变强。复制边际成本约等于零,且无损。
所以"两种物种"不是修辞,是生物学直译:进化速度由世代时间和遗传保真度决定——数字物种世代以分钟计、遗传零损耗。这两条曲线摆在生物学家面前,他不会惊讶:细菌和大象。
第三层 · 余量
每条技术曲线的天花板,都由一条物理定律标定。关键变量不是"有没有极限"——都有——是离极限还剩几个数量级。
物理世界的主力技术,全贴着墙跑:
- 热机:Carnot 上限 η = 1 − Tc/Th。最好的联合循环电厂 60% 出头,理论上限八成上下——余量不足一倍。
- 火箭:齐奥尔科夫斯基方程 Δv = ve·ln(m₀/m₁),化学键的能量密度封死了 ve——余量约等于零,所以火箭七十年没有质的提速。
- 民航:跨音速阻力墙加燃油经济,巡航速度钉死——余量为零。
计算的墙呢:Landauer(1961)——擦除一个 bit 的最小能耗 = kT·ln2 ≈ 3×10⁻²¹ J(室温)。
今天的芯片,每比特操作的实际能耗离这条底线还差着三到六个数量级(看你数到晶体管还是数到整机)。
同样在爬 S 曲线——
物理技术在天花板下几厘米处爬,计算在天花板下几公里处爬。
"迭代规律不一样"的第一性翻译出来了:
不是数字世界没有物理定律,是它离自己的物理定律还隔着好几个数量级的余量。曲线形状其实相同,我们只是站在两条 S 曲线的不同段位上。
第四层 · 换马
因为撞墙的是基板,不是信息。
物质的功能长在原子排列上:钢之为钢,是铁原子的那种排法;换材料,等于另起炉灶,积累大半清零。
信息的定义恰好相反:一个 bit 是"可区分的差异"本身,不属于任何载体。同一个 bit 可以骑在继电器上、真空管上、晶体管上、光子上——随时换到最便宜的那匹马背上,积累原样带走。
所以计算的宏观曲线是一串 S 曲线的接力:机电→继电器→真空管→晶体管→集成电路(Kurzweil 在《The Singularity Is Near》里画过这五棒);集成电路内部又是一串小接力:频率→多核→GPU→专用芯片。
物理产品的 S 曲线封顶是死刑;数字的封顶只是换马点。
再往下钻一格,碰到硬底了:
为什么信息能换马,物质不能?
因为"信息"这个词的定义,就是"与载体无关的那部分差异"。
再问"为什么基板无关的东西不被基板锁死"——只剩同义反复。
箭碰到逻辑的地基:
数字世界的指数不是奇迹,是"信息 = 基板无关"这个定义,在物理世界里收复利。
第五层 · 回流
三个伪证条件。谁出现,谁杀死"数字默认指数"。
① 没有下一匹马(killer)。
S 接力的下一棒是物理偶然,不是逻辑必然。如果后硅基板(光计算、3D 堆叠、新器件)在 2030s 没有一个完成成本交叉,数字曲线就地继承硅的 S 曲线尾部——指数变饱和,故事讲完。
② 瓶颈回流物理层(bear case,正在发生)。
数字世界是物理世界的房客:电力、fab、HBM、铜、冷却水。迭代闭环里只要有一个环节是原子的,整条曲线就被它封顶——Amdahl(1967):加速比 ≤ 1/s,s 是串行分数,此处读作物理分数。2024 年起,数据中心的电力缺口已经把原子环节顶回瓶颈位:指数没死,但在瓶颈解除之前,曲线临时姓"物理"。
③ 对称陷阱。
这套逻辑只适用于闭环全在 bits 里的东西。把"数字必指数"盖到一切带芯片的东西上——机器人、自动驾驶落地、新药——是反向犯同一个错:这些系统的世代时间被原子环节钉死(碰撞测试、临床试验、装机交付),n 上不去,(1+ε)^n 起不来。高估机器人和低估算力,是同一个病的两个症状:都没问瓶颈环节住在哪个世界。
判别钥匙一句话:
曲线由迭代闭环里最慢的环节决定。问那个环节是 bits 还是 atoms。
终点 · 闭环审计
对任何"X 五年后会怎样"的预测,四步:
第一步:画闭环。 写出 X 的迭代回路——设计→构建→部署→反馈——每个环节标 bits 或 atoms。
第二步:判型。 估物理分数 s(atoms 环节占一代时间的比例):
| 闭环 | 例子 | 曲线形态 | 估法 |
|---|---|---|---|
| 全 bits | 模型、软件、内容 | 指数(S 接力) | 禁用"当前用途外推",走第三步价格法 |
| 全 atoms | 火箭、电网、楼 | S 尾部 | 线性外推可用,别套指数 |
| 混合 | 机器人、自驾、药 | min(各环节) | 盯最慢的原子环节,按它的世代估 |
第三步:数字域用价格法重估。 价格每掉一个数量级,问一次:"什么场景从'不配用'变成'白送'?"把那批场景计入需求;再掉一个数量级,再问一次。需求清单是价格的函数,不是事实的清单。
第四步:挂触发器。
| 信号 | 读作 | 动作 |
|---|---|---|
| 电价、fab 交期、HBM 缺口拉长 | 瓶颈回流物理 | 降档:按物理曲线估,直到瓶颈解除 |
| 新基板成本交叉 / 原子环节被搬进 bits(仿真替代实验) | 换马 / 解锁 | 升档:恢复指数估 |
| 分析里出现"X 够用了" | 病句警报 | 查:"够"是不是对着固定需求说的 |
| 某混合系统被按纯指数定价 | 对称陷阱 | 找出它的原子串行环节,重算 s |
最后一句:
数字世界的指数不是魔法,是信息的定义在收复利;它唯一的死法,是被自己的原子房东锁了门。
预测之前别问"它会涨多快"——问:
它的下一代,要等谁?
(箭到底了。)
