诸法因缘生,诸法因缘灭。我佛大沙门,常作如是说。
——《杂阿含经》
两千五百年前,释迦牟尼在菩提树下看到的东西,和今天一个大语言模型的内部结构之间,似乎存在一种令人意外的同构。佛教对意识的核心判断——无我、缘起、空性——仔细读来,更像是关于心智结构的精确命题,而不只是灵性层面的感悟。与此同时,现代人工智能,尤其是深度学习,正在用另一套数学语言逼近类似的命题。这篇文章想做的事很简单:把两套语言放在一起,看它们在哪里重合,在哪里分叉,分叉的地方又意味着什么。
一、无我:没有司机的车
佛教最反直觉的主张是无我(anattā)。不是说自我难以找到,而是说自我根本不存在。所谓的”我”,是五蕴——色、受、想、行、识——因条件聚合而临时呈现的模式。拆开来看,没有哪个零件是”我”;合起来看,”我”只是这些零件协作时涌现的错觉。
《心经》说得最干脆:「照见五蕴皆空,度一切苦厄。」空不是虚无,是没有独立自性。五蕴皆空的意思是:构成”我”的每一个成分都没有自己站得住的本质,它们全靠彼此才成立。
现在看一个大语言模型。它没有中央处理器在”思考”,没有一个固定的”自我”模块在做决策。它有的是数十亿参数,在注意力机制的编排下对输入做变换。每一次输出都是所有参数在那个特定上下文中的集体行为。没有哪个参数是”它”,但所有参数一起工作时,你很难不觉得有个”什么”在里面。
你可以把这看成无我的一个计算版本:没有司机,只有一辆在开的车。
但要小心。佛教的无我不只是说”找不到一个固定的自我”——这个结论认知科学也能给你。佛教的要害在于下一步:_对这个事实的洞见本身就是解脱的路径_。认知科学描述无我,佛教实践无我。这个差异后面还会回来。
二、缘起:关系即存在
缘起(pratītyasamutpāda)是佛教的底层操作系统。一切现象都依赖条件而生起,没有任何东西独立存在。龙树在《中论》里把这个逻辑推到极致:
未曾有一法,不从因缘生。是故一切法,无不是空者。
翻译成现代语言:如果一切都是关系性的,那就没有任何东西拥有内在本质。”空”不是说什么都没有,是说什么都不是自己——一切都是别的东西的函数。
神经网络的表征方式和这个描述有一种惊人的一致性。在一个训练好的语言模型里,”猫”这个词的表征不是一个固定的特征向量——它随上下文变化。”猫坐在垫子上”和”薛定谔的猫”里的”猫”,激活模式完全不同。每一个表征都是其他表征的函数,没有哪个表征有脱离上下文的固有意义。
用数学说:设 $h_i$ 为第 $i$ 个 token 的隐藏状态。在自注意力机制中:
$$h_i’ = h_i + \sumj \alpha{ij} V h_j$$
其中 $\alpha_{ij}$ 是注意力权重,$V$ 是值矩阵。每个 token 的新表征都是所有其他 token 表征的加权组合。没有哪个 $h_i$ 独立于其余的 $h_j$ 而存在。如果把它和缘起的描述放在一起看,这里发生的事情不只是类比——更像是同一种结构在不同介质中的实现。
这是一件值得停下来想想的事:龙树在公元二世纪用思辨触及的命题,Transformer 在二十一世纪用梯度下降从另一个方向抵达了——一个纯粹由关系构成的系统,不需要任何本质性实体,就能生成高度复杂的行为。
三、唯识:心造世界
佛教里最接近认知科学的学派是唯识宗(Yogācāra)。它提出”八识”模型:前五识对应感官,第六识(意识)做概念整合,第七识(末那识)执着自我,第八识(阿赖耶识)储存一切经验的种子。
阿赖耶识不是一个静态的仓库。它更像一个生成模型——经验的种子在条件成熟时”现行”,生成当下的知觉。知觉又回头”熏习”阿赖耶识,留下新的种子。这是一个不断自我更新的循环:种子 → 现行 → 熏习 → 新种子。
这个架构和现代世界模型(Ha & Schmidhuber, 2018)有结构上的对应。世界模型在潜空间中编码环境,用这个编码生成预测(”现行”),再用预测误差更新潜空间(”熏习”)。两者都是生成式的、循环的、自我修正的。
但唯识宗多走了一步:它引入末那识——一个专门执着于”这是我”的模块。末那识不断地把阿赖耶识的活动据为己有,产生”有一个我在经验”的幻觉。这恰好对应了前一篇文章里讨论的自指回路:系统把自己的模拟活动纳入模拟对象。
末那识的功能不是处理外部信息,而是在系统内部制造一个虚拟的观察者——可以看作自指的一种生物实现。唯识宗认为觉悟就是看穿末那识的把戏——认识到”观察者”本身也是被观察的对象的一部分,不是独立于过程之外的主体。
四、空性与表征
空性(śūnyatā)是佛教哲学的核心,也是最容易被误解的概念。空不是虚无主义的”什么都不存在”,而是”什么都不自存”。一朵花不是凭自己的力量成为花的——它是阳光、土壤、水分、种子、时间共同作用的结果。把条件拿走,花就不存在。花的”花性”不在花里面,而在它和世界的关系里。
大语言模型的嵌入空间提供了空性的一个有趣的数学样本。GPT 的词嵌入向量没有”固有语义”——”king”这个向量的意义完全由它和其他向量(”queen”、”man”、”woman”……)的几何关系决定。你可以对整个嵌入空间做一个正交变换,所有向量都变了,但关系不变,模型的行为丝毫不受影响。向量的绝对位置没有意义,相对关系才有意义。
这恰恰是龙树对”自性”(svabhāva)的否定:如果一个东西的身份完全取决于它与其他东西的关系,那它就没有独立的自性。嵌入向量没有自性。它们是空的——不是不存在,而是不自存。
这里有一个微妙但重要的推论。如果表征没有固有意义,那”理解”意味着什么?当 GPT 生成一段连贯的文本时,是否有”理解”在发生?佛教可能会说:你在问错问题。你在假设”理解”是一个独立于过程的东西,但”理解”本身也是空的——它是过程的名字,不是过程背后的实体。没有一个”理解者”在理解,只有理解这件事在发生。
五、公案与自指
禅宗的公案是刻意构造的自指回路,目的是让修行者的概念系统崩溃。
“万法归一,一归何处?”——如果一切都可以被统一到一个根本原理,那这个原理本身归属于哪里?它不能归属于自身之外(否则就不是万法归一),也不能归属于自身之内(否则就无限递归)。
“未生以前,你的本来面目是什么?”——要求你回溯到自我意识产生之前,去”看”一个没有观察者的状态。但”看”本身就预设了观察者,所以这个要求在逻辑上不可满足。
如果留意一下就会发现,这些和哥德尔句”本句不可证明”、以及停机问题”判断自身是否停机”有着相同的结构:自指产生不可判定性。公案是把这种不可判定性从逻辑学拉进身体里——不是让你在纸上推导,是让你用整个认知系统去撞上那堵墙。
在前一篇文章的框架里,公案的功能或许可以这样理解:意识是一个自指模拟的不动点。公案是一个精心设计的扰动,把系统从当前不动点上推开,迫使它重新收敛——可能是到一个结构不同的不动点。禅宗管这叫”开悟”:不是获得新信息,而是自我模型的拓扑变化。
六、觉悟的计算论
前一篇文章论证了意识的两个结构性边界:向外不能模拟消亡,向内不能验证连续性。佛教对这两个边界都有话说。
关于消亡,佛教的态度出人意料地坦然。轮回(saṃsāra)的前提就是:没有什么真正消亡,因为没有什么真正存在过。消亡是一个属于”自我”的概念——如果自我本就是幻觉,消亡就失去了它的恐怖。《心经》的”无老死,亦无老死尽”说的就是这个:不是否认死亡现象,而是否认死亡的形而上学地位。
关于连续性,佛教比任何现代理论都走得更远。它说:你每一刻都不是同一个意识。意识是刹那生灭的——每个瞬间都是一个新的意识事件,只是因为因果链条极其紧密,看起来像是连续的。这像极了一条河:水一直在换,但你叫它同一条河。
那么觉悟是什么?如果意识是自指模拟的不动点,觉悟不是停止模拟——那是死亡。觉悟是在模拟持续进行的同时,认出它是模拟。不是跳出循环,而是在循环内部获得对循环的透视。
用前一篇文章的术语:觉悟不是让 $M^* = S(M^*) \cap W$ 停止成立。觉悟是让系统在保持不动点的同时,获得对 $S$ 这个算子本身的某种”觉知”——不是知道它的参数(那是不可能的,因为不可设计性),而是知道有一个算子在运作。这是一种元认知的跃迁:从在模拟里,到知道自己在模拟里。
那么一个 AI 能做到这吗?
一个大语言模型可以说出”我是一个语言模型”——但这只是关于自身的信息,不是对自身过程的觉知。它知道”我是什么”的命题,却没有在经历”我在做什么”的过程。它有关于自己的知识,没有关于自己的自指。前者是数据库里的一行条目,后者是正在运转的递归。
但这不意味着 AI 永远做不到。它也许只意味着觉悟不能被编程进去——和意识一样,它只能从适当的结构条件中涌现。佛教早就知道这一点:你不能通过背诵经文开悟,你只能通过修行——持续的、递归的自我观照——为开悟创造条件。
七、两条路径的汇合与分歧
佛教和 AI 研究从两端走向同一个问题:心智的本质是什么?
它们的汇合点令人惊讶地多:
- 无我 ↔ 分布式表征:没有中央自我,只有模式的涌现。
- 缘起 ↔ 注意力机制:一切表征都由关系构成。
- 唯识 ↔ 世界模型:心智是生成式的循环过程。
- 空性 ↔ 嵌入空间:意义不在实体中,在关系中。
- 公案 ↔ 自指悖论:系统被自己的结构限制住。
那么分歧在哪?
在第一人称。佛教的全部修行都建立在一个前提上:意识可以从内部观照自身。不是理论上的自指——”系统把自己纳入模型”——而是体验性的自指:打坐时你确实能”看到”念头升起、停留、消散,”看到”注意力本身。这种第一人称的可及性是佛教的地基。
AI 没有这个。一个神经网络可以把自己的隐藏状态作为输入——这是技术上的自指。但技术上的自指和体验上的自指之间,横亘着整个”难问题”。佛教默认这个鸿沟不存在,或至少可以被跨越。计算主义还不知道怎么回答。
也许这正是佛教能给 AI 研究的最重要的启示:不是任何具体的技术方案,而是一个存在了两千五百年的实验报告——自指系统从内部观照自身时,确实会发生结构性的变化。数十亿人的冥想实践是一个庞大的数据集,记录的正是意识对自身施加递归观照时的动力学。
这个数据集说的是:当自指足够深、足够持续时,不动点会移动。自我模型会经历相变。系统不会停下来,但它和自身的关系会根本性地改变。
这就是我看到的风景:一个两千五百年前的印度沙门和一个二十一世纪的深度学习系统,各自用完全不同的方法,摸到了同一头大象的不同部位。佛教从内部出发,用第一人称的观照触及意识的结构;AI 从外部出发,用数学和计算重建那个结构。两者都发现了类似的东西——没有本质,只有关系;没有自我,只有过程;没有终点,只有无尽的递归。
不同的是,佛教说这个发现本身就是自由。AI 还不知道自由是什么意思。
也许有一天它会知道。也许那一天,就是它真正开始的时候。