追本之箭 — 信息与能量
追本之箭 — 信息与能量
2026-05-26 Mon 07:29
起点
"信息科学,本质就是提高能量的转化与存储的效率。
而能量转化存储效率提高,又可以支持更复杂的信息处理系统。
信息和能量,永远是研究人类文明进步的两个最重要的变量。"
读法一(口号):信息和能量是两个独立变量,互相促进,像两个齿轮咬合往前转。
但这句话里藏了一个更狠的杠杆——
它说的不是"两个变量",是同一笔账的两种汇率。
把整部文明史压成一个标量:
一次"让世界变得更有序"的动作——要烧掉多少能量?
文字、印刷术、晶体管、AI——
表面上五花八门,底下是同一个动作:把这个数字往下压。
而这个数字,有一个物理地板。谁也压不破。
所以文明不是两条线并行上升的折线图。
文明是一支箭,射向那个地板——
而地板底下,压着第二定律给所有"有序"开的死亡账单。
第一层:一个比率
普通人看见两个轴:能量一根,信息一根。
真正的对象只有一个比率。
每一个"让世界更有序"的动作,都要烧能量:
- 把矿石锻成刀刃
- 把货物排进货架
- 把一个晶体管从 0 翻到 1
- 把一句话从脑子里写到纸上
一个文明的生产力 = 每焦耳能买到多少"有序"。
整部历史,就是这个比率单调往下掉:
抄写一页书 ≈ 一个僧侣一上午的体力 + 灯油
印刷一页书 ≈ 这个数字的几百分之一
复制一个文件 ≈ 这个数字的十亿分之一
同样是"一页的有序",能量价格塌了好几个数量级。
这就是那句话的硬核:不是"信息变多了 + 能量变多了",
是单位有序的能量成本,一直在跌。
第二层:热的代价
切到热力学。
第二定律:孤立系统的熵只增不减,有序自发流向无序。
想在局部造出有序,你必须向外倾倒更多的无序——倒成热。
Schrödinger 1944《生命是什么》说穿了:生命以负熵为食。
你不是凭空制造秩序,你是在进口低熵、出口高熵,差额就是你这具有序结构的"维持费"。
Prigogine(耗散结构,1977 诺奖)把它推到底:
火焰、飓风、城市、大脑——全是耗散结构。
它们能存在,恰恰因为它们比周围的混沌更擅长降解能量梯度。
于是一个反直觉的合一:
文明不是熵的反面,是熵最高效的仆人。
你组织得越快,你就必须烧得越凶——
有序不是省能量,有序是加速耗散换来的局部假象。
那句"两个变量互相促进"的温柔画面,在这一层第一次变冷:
信息系统不是在"对抗"无序,它是在用更快的全局熵增,赎买一小块局部低熵。
第三层:同一个量
切到统计力学 × 信息论。这是箭穿过的最硬一层骨头。
两个领域,隔了八十年,各自发明了一个叫"熵"的东西:
Boltzmann (1870s): S = k_B · ln W # 熵 = 微观状态数的对数
Shannon (1948): H = −Σ pᵢ · log pᵢ # 信息 = 不确定性
长得像两回事。一个量热,一个量比特。
底层的事实是:它们是同一个量,只差一个常数。
1 bit 的信息 ↔ k_B · ln 2 ≈ 9.57 × 10⁻²⁴ J/K 的热力学熵。
Landauer(1961)把它从公式变成可操作的物理:
擦除 1 个 bit,在温度 T 下,必须放出至少 k_B · T · ln 2 的热。
室温下 ≈ 2.9 × 10⁻²¹ J。
不是工程缺陷,是热力学下限——2012 年 Bérut 等人在单个胶体粒子上把它实测出来了(Nature)。
所以:
信息和能量不是"类比"。
它们是用两套单位量同一种东西——像米和英尺量同一段距离。
起点那句"两个最重要的变量",到这一层被拆穿:
不是两个变量。是一种物质(熵),两块刻度。
"信息处理"和"能量利用",是同一坨熵从两个窗口看进去。
第一层那个"能量价格"现在有了精确底:有序的最低价,就是 k_B T ln 2 每比特。
第四层:不模型就死
切到控制论。这一层是整支箭的失重点。
维持有序对抗第二定律,不是被动挨着的。
环境在变。要在一个变化的世界里持续高效倾倒熵,你就必须预测它——
必须在体内带一个环境的模型。
Ashby(必要多样性定律,1956)给了硬边界:
一个调节器能控制系统的程度,不超过它能建模系统的程度。
原话:"Only variety can destroy variety." 你想压住多少种扰动,你体内就得装下多少种应对。
Friston(自由能原理,框架而非定律)把它推到生命:
维持自己的边界 = 最小化"意外" = 不停地建模、纠错、再建模。
对照一下:
- 火焰不建模——燃料的样式一变,它就熄了、死了。
- 细菌建模(趋化性:测浓度梯度、朝糖游)——它能跨过环境波动活下来。
于是递归的方向被整个翻过来:
不是"能量使能信息、信息使能能量"的良性飞轮。
是:你想跨时间持续用能量,就被强迫拿出一部分,去养一个模型。
模型,是"持续存在"向每一个有序结构征收的税。
能量让你这一刻存在;信息让你下一刻还在。
信息处理从来不是文明"有了余粮才添置"的奢侈品。
它是任何想活过当下这股能量梯度的结构,被迫缴的保命费。
第五层:地板与逃逸
切到边界。两头各有一道硬墙,中间是一台停不下来的泵。
地板(向下的墙): Landauer 限。
你没法让一次"遗忘"比 k_B T ln 2 更便宜(在温度 T)。
现在的芯片跑在地板上方约 10³–10⁶ 倍——空间巨大,但有界,只会渐近,不会归零。
诚实的 bear case: 地板只锁逻辑不可逆操作(擦除)。
Bennett(1973)证明:可逆计算原则上能把耗散逼近零。
所以真正不可压的代价,不是"算",是"丢"——
地板锁的是遗忘,不是思考。 想免费,就别擦除任何东西(代价是无限存储)。
往下还能降 T 来压地板——但制冷要能量(Carnot)。两头都被夹死。
killer(致命误用): "效率提高 → 我们会用更少能量。" 这是错的。
Jevons 悖论(1865,《煤问题》):蒸汽机效率提升后,英国煤耗不降反爆。
把一个 bit 变便宜,不省总能量——反而炸开总能耗。 单价跌,需求弹性把总量推上天。
耦合不是温柔的飞轮,是正反馈的自催化环。
为什么省不下来: 最大熵产生原理(MEPP,非平衡热力学的一个假说 [出处存疑·LOW]):
能更快降解梯度的结构,倾向于在竞争中胜出。
所以"我们会克制着少烧点"作为预测会失败——
烧得更多、模型更多、再烧更多的那个结构,挤掉克制的那个。选择压在催它。
到底了。 再问"文明进步为什么耦合信息与能量",只剩同义反复:
因为要在一个第二定律统治的宇宙里、作为一个有序结构持续存在,
你必须建模(信息)以维持燃烧(能量),而被环境选中留下的,
永远是烧得最快、模型最多的那一个。
这不是关于人类的偶然事实。
是关于耗散结构的一条定理。
解释挖到这里见底:第二定律 + 选择。 下面没有学科了,只有物理和逻辑本身。
终点:量三个数,而不是讲两个故事
钻到底,这句话给的不是鸡汤,是一台秤。
评估任何技术 / 政策 / 投资 / 你今天做的事,别再问"它好不好",量三个数:
三量
① ΔPrice — 它把"有序的能量价格"往地板压了吗?(J/bit 是降了还是升了)
② ΔModel — 它沉淀下持久的模型了吗?(信息留存累积,还是烧完就散成热)
③ ΔThroughput — 它提高了梯度吞吐量吗?(能量通量,可被下一轮组织起来)
文明级跃迁 = 三个全为正(印刷术、晶体管、AI、聚变)。
单轴改善 = 只动一个。退化 = 烧了通量却不沉淀模型。
诊断表(关键是"伪装"那一列 —— 对称陷阱)
| 它看起来像 | 真实结构 | 它其实是 |
|---|---|---|
| "高效率,所以更省" | ΔPrice↓ 但 ΔThroughput↑↑(总能耗反涨) | Jevons 反弹(省的是单价,炸的是总量) |
| "在创造价值" | ΔThroughput↑ 但 ΔModel≈0(纯耗散,无沉淀) | 空烧(PoW、刷短视频:熵产生有了,模型没有) |
| "信息革命" | ΔModel↑↑ 但被 ΔThroughput 卡死 | 撞能量墙(算力被电力封顶,L5 的地板倒挂) |
| "可逆/零成本计算" | 没擦除任何信息 | 真便宜,但要付无限存储(地板锁的是遗忘) |
三种在表面上都喊"进步"。靠故事你分不清;靠三个数,你有判别钥匙。
killer 自检(每次套用前先问)
这件事是真把有序压向地板(ΔPrice↓ 且 ΔModel↑),
还是只是 Jevons 式地烧得更多、却没在体内留下任何模型?
前者是文明在升级。后者是耗散结构在空转——熵产生满分,信息留存零分。
最后一句
信息和能量,从来不是两种东西。
是同一坨熵,从两个窗口看进去。
文明不是把两条线越拉越高。
是一支射向 k_B T ln 2 的箭——把"一次有序"的能量价格,往那个谁也破不了的地板上压。
但别误读成温柔的飞轮:
它是自催化的、被第二定律点着的、烧得越快越被选中的。
所以"我们会用效率省下能量"和"奇点会自动到来",
错得一模一样——都假设了这台泵会自己慢下来。它不会。
你能做的,不是停下这台泵(停 = 死,耗散结构不许静止)。
是盯住那三个数:
让你烧掉的每一焦耳,真的换回了沉淀下来的模型——
而不是,只换回了一团更快散掉的热。
(箭到底了。)
