AI、认知科学、创造力·

压缩进步驱动:一个统一解释好奇心、美感与创造力的算法原理

深入探讨 Jürgen Schmidhuber 的革命性理论:为什么婴儿的笑声、科学家的发现、艺术家的创作和一个精彩的笑话,背后都是同一个简单的算法原理?

引言:一个看似不可能的统一理论

想象这样几个场景:

  • 一个咿呀学语的婴儿,饶有兴趣地探索着自己的双手
  • 一位物理学家废寝忘食,只为发现一条新的自然定律
  • 一位作曲家在钢琴前,试图谱写出能触动灵魂的旋律
  • 一位喜剧演员在舞台上,精准地抛出一个"包袱",引爆全场大笑

这些场景之间能有什么共同点?

答案或许会让你大吃一惊。著名人工智能科学家 Jürgen Schmidhuber 在一篇影响深远的论文中提出:所有这些看似天差地别的人类活动——包括主观的美感、新奇、惊讶、有趣、注意力、好奇心、创造力、艺术、科学、音乐,甚至笑话——都可以被一个单一、简单的算法原理所解释。

这个原理,就是**"压缩进步驱动"**(Compression Progress Drive)。

这是一个极其大胆的宣言。它试图为人类认知和创造力中那些最深刻、最"人性"的方面,提供一个统一的计算基础。本文将带你深入这个理论的核心,探索它如何揭示好奇心与美感的奥秘,以及它对理解人类心智和构建真正智能的机器有何启示。

打破传统:白噪音悖论

要理解压缩进步理论,我们必须首先打破一个传统观念。

传统的信息论,尤其是源自玻尔兹曼(Boltzmann)和香农(Shannon)的理论,将「惊喜」或「新奇」与事件的「不可预测性」直接挂钩。在这个框架下,一个事件越是出乎你的意料,它所包含的信息量就越大,因此也就越「令人惊讶」。

这个理论的完美范例是「白噪音」(White Noise)。想象一下老式电视机在没有信号时满屏闪烁的「雪花点」。从传统信息论的角度看,这是你能遇到的最「令人惊喜」的东西——屏幕上的每一个像素都是完全随机、无法预测的。

然而,悖论也随之而来:白噪音是极其无聊的。

为什么我们会对这种「最大程度的惊喜」感到极度厌烦?同样,为什么我们对一个完全可预测的模式(比如一个音符无限循环播放)也感到无聊?

显然,我们所谓的「有趣」既不是完全的随机,也不是完全的可预测。它存在于这两者之间的某个地带。

这正是 Schmidhuber 理论的切入点。

他明确地拒绝了传统信息论对「惊喜」的定义。他指出,真正的新奇和惊喜,并不在于数据的随机性,而在于数据中蕴含着我们尚未知晓的、但可以被学习的算法规律

这个转变是革命性的。它重新定义了我们的角色:我们不是被动的「信息接收者」,为低概率事件感到兴奋;我们是主动的「模式发现者」,我们的快感来自于发现并掌握那些可学习的规律。

核心机制:大脑作为「懒惰」的压缩引擎

Schmidhuber 理论的核心隐喻是:大脑(或任何智能体)本质上是一个「自适应的数据压缩器」

他提出了一个「懒惰的大脑」(lazy brain)理论。这个「懒惰」并非贬义,而是一种对效率的极致追求。大脑的根本目标之一,是用尽可能少的「信息比特数」来存储和解释它所观察到的整个世界历史。

压缩的智慧

想象一下存储一部电影:

  • 愚蠢的方法:把每一帧图像都当作独立的图片存起来,需要海量数据
  • 聪明的方法:只存储第一帧图像,然后存储一个「定律」(比如:「在接下来的 5 秒内,一个红球以特定轨迹从左上角移动到右下角」),再加上一些「偏差」(比如:球在第 3 秒时轻微晃动了一下)

这种「定律+偏差」的存储方式,其效率比存储每一帧图像高出无数倍。

大脑正是在不断地、狂热地寻找这些「定律」,以便让自己的工作(即编码世界)变得更简单。这个过程,就是所谓的「数据压缩」。

为什么要压缩?

这种对「懒惰」的追求,恰恰是智能的核心引擎。智能体之所以要不懈地压缩历史数据,是因为一个对过去的更好、更简洁的解释(即更好的压缩),通常也意味着对未来的更好的预测能力

因此,这种压缩驱动力是所有智能体实现未来目标(比如生存、觅食、规划)的先决条件。我们所谓的「理解世界」,不过是这种对数据效率痴迷所带来的副产品。

什么是压缩进步?

「压缩进步」指的是压缩效率的提高——也就是我们发现了更好的方法来解释和预测数据,比之前所掌握的方法更胜一筹。

举个例子:如果给你一串数字「123123123123」,你可能会注意到「123」重复了四次,于是可以用「123 重复 4 次」来简明地描述它——这就是压缩思想。当你找到这个模式时,就实现了「压缩进步」。

在科学史上:

  • 牛顿的万有引力定律,可以用一小段简短的代码来表述,但它却允许我们实质性地压缩许多观察序列(比如苹果下落、行星运行)
  • 爱因斯坦的广义相对论产生了额外的压缩进步,因为它不仅压缩了牛顿能压缩的数据,还额外压缩了那些牛顿定律无法解释的「偏差」(比如水星的近日点进动)

美的本质:简洁性的主观体验

这个理论首先为我们解开了「美」的奥秘。

Schmidhuber 为「主观的美」提供了一个算法定义:美,并不是一个客观存在于物体中的属性。相反,它是一个主观的、随时间变化的量度,取决于观察者在特定时间能以多大的效率来压缩数据。

简而言之:美 = 简洁性(或可压缩性)

当一个观察者发现数据中隐藏的规律,并能用一个更短、更简单的「算法」或「解释」来描述它时,这些数据对这个观察者而言就变得更美了。

面孔的美感

考虑人脸的例子。我们的大脑在观察过许多张人脸后,会提炼出一个抽象的「平均脸」模型。看到新面孔时,大脑只需记下它与「标准脸」的差异,就能有效表征这个新脸。

因此:

  • 那些长相接近平均脸的人,在我们眼中往往更顺眼——因为与我们记忆中的模板差别小,描述起来最省事
  • 具有明显对称性的脸也容易被认为好看——对称本质上提供了一种简单规律:左半边脸可以由右半边「复制」得到

大脑的压缩器可以利用这种规律,大幅减少存储和处理的信息量。于是,我们会对对称的事物产生一种天然的好感,觉得它们「很美」。

美的主观性

需要强调的是,美感是因人而异、因时而变的。同一件东西,对懂行的人也许美如天成,对门外汉可能就毫无吸引力。这并不是因为双方审美水平高低之分,而是所掌握的模式和背景知识不同。

比如,某些复杂的现代派音乐,在缺乏相应音乐训练的听众听来杂乱刺耳,因为他们找不到其中的结构;但在音乐素养高的人耳中,这些乐音蕴含独特的规律,因而别有一番美感。

美是主观的压缩体验:你的大脑能压缩某种模式,你就觉得它美,否则可能就觉得它无意义或者丑陋。

有趣的秘密:「啊哈!」时刻与学习曲线

这是整个理论中最核心、最关键的洞见。

Schmidhuber 明确地区分了静态的「美」和动态的「有趣」:

「美的东西,不一定有趣。」

  • 美(Beauty)是一个状态。它衡量的是你的大脑已经能多好地压缩某个数据
  • 有趣(Interestingness)是一个过程。它衡量的不是你压缩得有多好,而是你学会压缩得更好的速度有多快

在数学上,Schmidhuber 将「主观的有趣性」定义为「主观的美(或可压缩性)的一阶导数」。

学习曲线的陡峭程度

让我们把这个数学术语翻译成大白话。这个「一阶导数」,就是「学习曲线的陡峭程度」。

  • 如果一个东西你已经完全理解了,你的学习曲线是平的(斜率为零)。它很美,但它不再有趣
  • 如果一个东西完全无法理解(比如白噪音),你的学习曲线也是平的(斜率为零)。它既不美,也不有趣
  • 「有趣」只存在于学习曲线最陡峭的那一刻

那种「啊哈!」(Aha!)的时刻——那种你突然「搞懂了」的感觉——就是你的大脑的压缩算法刚刚取得了一次巨大飞跃的信号。

蝴蝶与花瓶的例子

想象你看到一幅由蝴蝶、花瓶和花朵组成的精美图案。它看起来很复杂,也很「美」。

然后,有人向你揭示:这幅复杂的图案,实际上是由一个极其简单的「分形圆」算法生成的(大圆的交点或切点,成为小半圆的圆心,依此类推)。

当你理解了这个简单算法,并回头再看那幅图时,你所体验到的那种「原来如此!」的愉悦感——这个过程本身,就是「有趣」。

你的大脑刚刚把一个看似复杂的数据集,用一个极短的算法给成功压缩了。你的「主观美感」在短时间内急剧上升。这个上升的速率(学习曲线的陡峭程度),就是你的「有趣」奖励。

有趣 vs. 无趣

我们常说「一件事很有趣」或「太无聊了」,背后的原因何在?

有趣之处在于过程,而无聊常常源于两极:

  1. 过于熟悉(信息过少):比如整天盯着一面空白的墙,视觉输入单一而可压缩,几乎没有新鲜事——这是典型的沉闷无聊
  2. 完全无序(信息过多):例如让你一直看电视机雪花噪点,它每秒都在变化,信息量巨大却全是随机,没有任何可循的模式——同样会感到厌烦

只有介于两者之间、既非完全可预期也非完全随机的情境,才能带来真正的兴趣。因为在这种情境下,你的大脑面临一些尚未掌握但可以掌握的新模式——有东西可学,又不是学不会

音乐的例子

听音乐就是很好的说明:

  • 无聊(过于简单):刚刚连续听了十遍的歌。它变得「太可预测了」,学习曲线为零
  • 无聊(过于复杂):刺耳的白噪音,或者「节奏和音调完全不熟悉的怪异」音乐。它「似乎太不规则了」,你的压缩器无法从中找到任何规律,学习曲线也为零
  • 有趣(「金发姑娘」区域):一首歌,它「足够陌生,包含一些意想不到的和声或旋律」,但又「足够熟悉,让你能够迅速识别出」新的、可学习的规律

这个理论为著名的「心流」(Flow State)或维果茨基的「最近发展区」(Zone of Proximal Development)提供了一个坚实的算法解释。我们天生就会被那些处于我们能力边缘的任务所吸引——那些既不是太容易(因为没有进步空间,奖励为零)也不是太难(因为无法取得进步,奖励也为零)的任务。

好奇心的源泉:内在奖励机制

好奇心究竟从何而来?

按照压缩进步理论,好奇心就是大脑对「压缩进步」给予奖励的一种表现

内部奖励的机制

当我们接触新的事物,若隐约觉得其中有规律可循,大脑就会产生期待和兴奋,促使我们去探究。一旦我们通过努力识别出隐藏的模式,预测能力提高了,大脑内部的奖赏机制就会被触发,让我们感到愉悦和满足。

这种奖赏不需要外部给予——不需要糖果、金钱或表扬——而是一种由内而外的成就感。

学杂耍的例子

Schmidhuber 本人提到,他在 25 岁时学会抛接球(杂耍),每次在镜子前看到自己坚持的时间变长,都会露出傻傻的笑容。而当他年幼的女儿第一次独自行走几步时,小女孩脸上也绽放出同样得意的笑容。

这些发自内心的笑意,正是大脑内部好奇奖励机制在起作用——我们的大脑因发现了新的、可预测的规律而奖励自己

学会抛接球带来了全新的感官数据流(毕竟观看自己抛球和看别人抛球的感觉很不同),这个以前未知的感官规律让大脑兴奋不已,于是我们感到快乐,直到逐渐习惯为止。

婴儿的探索

这种内部奖励解释了婴儿和成年人的许多探索行为:

  • 婴儿扔勺子、反复打开柜子,不厌其烦地玩「躲猫猫」
  • 每次重复中他们总能学到点新东西——汤勺掉地会发出声音,柜门打开会看到新景象,妈妈每次出现又消失都令他们惊奇不已

虽然大人看来这些很普通甚至无聊,但对婴儿来说,一切都是新奇而有规律可循的,这种好奇心驱动促使他们不断尝试,从中获取内部奖赏。等到相关模式完全掌握,这些游戏便不再吸引他了。

驱动力的本质

正是这种对模式和简洁性的追求,引发了人类源源不断的好奇心和探索欲。这种「压缩进步」本身,就是大脑奖励自己的方式。这种「内在奖励」或「好奇心奖励」,驱使着「探索的婴儿、纯数学家、作曲家和艺术家」。

我们(以及婴儿、科学家和艺术家)的驱动力,就是在世界上寻找那些能让我们的「学习曲线」变得最陡峭的挑战,因为那里,就是「内在奖励」最大的地方。

创造力的统一解释

一旦掌握了「压缩进步」这个核心驱动力,我们就可以像戴上一副新眼镜一样,重新审视人类所有伟大的创造性活动。

科学家的追求:寻找压缩定律

科学,是「压缩进步」驱动力的最规范、最正式的体现。

科学家们「主动选择实验,以寻找能够压缩由此产生的观察历史的、简单而新颖的定律」。他们是终极的「压缩猎人」。

例如:

  • 牛顿:万有引力定律可以用一小段简短的代码来表述,但它却允许我们实质性地压缩许多观察序列
  • 爱因斯坦:广义相对论产生了额外的压缩进步,解释了牛顿理论未覆盖的现象

驱动力:科学家之所以废寝忘食,往往不是为了物质奖励,而是因为发现新定律本身带来的那种「啊哈!」的快感——那是一次巨大的压缩进步。

艺术家的策略:设计「有趣」

如果说科学家是「发现」压缩规律的人,那么艺术家和音乐家就是「工程设计」压缩规律的人。

他们精心创造出数据(画作、音乐),其目的就是为了最大化观察者的「压缩进步」奖励。

以音乐为例:

  • 无聊(过于简单):一首你「刚刚连续听了十遍」的歌。它变得「太可预测了」,学习曲线为零
  • 无聊(过于复杂):刺耳的白噪音,或者「节奏和音调完全不熟悉的怪异」音乐。它「似乎太不规则了」,你的压缩器无法从中找到任何规律,学习曲线也为零
  • 有趣(「金发姑娘」区域):一首歌,它「足够陌生,包含一些意想不到的和声或旋律」,但又「足够熟悉,让你能够迅速识别出」新的、可学习的规律

这就是为什么:

  • 流行音乐(简单、易学的规律)如此受欢迎
  • 像勋伯格(Schönberg)的「十二音体系」音乐(其算法更复杂)不那么流行,但对于那些受过训练、理解其规则的听众来说,却可能带来更巨大的「压缩进步」快感

喜剧的机制:瞬间、海量的压缩进步

笑话,是这个理论的「杀手级应用」。

一个笑话的机制,是「压缩进步」的一次完美风暴:

  1. 铺垫(The Setup):喜剧演员开始讲故事。他引导你的大脑(你的「预测器/压缩器」)建立一个关于故事走向的低效模型,并让你做出一个特定的预测
  2. 包袱(The Punchline):「包袱」以一种「新颖的方式」将「众所周知的概念结合起来」。它瞬间击碎了你刚刚建立的那个低效、错误的模型
  3. 大笑(The Laugh):在「包袱」落地的瞬间,你的大脑被迫立即对整个故事进行「重新压缩」,使用一个全新的、更简洁的、你「之前未曾注意到的规律」

这种从旧的、臃肿的解释,到新的、极简的解释的突然转变,产生了一次巨大的压缩进步。

「哈哈!」的快感,本质上就是「啊哈!」的快感。

笑声,很可能就是大脑在经历一次极其快速、成功的「代码优化」时,所释放出的生理反射性奖励信号。

这个理论还指出,这种快乐与一个婴儿第一次成功站立,或者一个成年人学会玩杂耍时,脸上露出的「傻笑」是完全相同的。它们都是对「压缩进步」——即掌握了新的、可预测的规律——的内在奖励。

创造力的共同本质

科学与艺术的共同点在于:两者都是对未知模式的探索,都是试图「压缩更多数据」的渴望

科学要寻找客观规律,艺术则创作主观体验中的新模式,但本质都是在已有知识的边界上开拓新的可压缩领域。

Schmidhuber 直接指出:科学和艺术可以被视作同一种欲望的不同体现——通过创造或发现新的方式来压缩更多的信息

科学家和艺术家都受到好奇心的驱使,从内部获得动力去追求新颖但有意义的事物。他们沉浸于各自的问题或创作中,往往不是为了物质奖励,而是因为发现新模式本身带来的欣喜。

一个数学家破解难题时的那份快乐,与一位作曲家写出新曲时的激动,其实是一脉相承的。

意识:压缩的必然副产品

在探讨了好奇心、美感和创造力之后,Schmidhuber 用一个简短但震撼的论述,几乎是「顺便」提出了一个关于**意识(Consciousness)**起源的观点。

他的论证完全是功能性的、算法性的:

一个智能体的目标是尽可能高效地压缩其全部的感官历史。在智能体的「所有行动和感官输入」中,有一个东西是永远存在的、重复出现的常量,那就是「智能体本身」。

因此:

「为了有效地编码整个数据历史,它将受益于创建某种内部符号或代码……来代表智能体自身。」

结论是:当这个代表「自我」的内部符号被激活时,「这个智能体就可以被称为自我意识或有意识的」。

Schmidhuber 称这是一个「直截了当的解释」,并表示它在论文中「不会扮演重要角色」。但这种轻描淡写本身,就是其深刻之处。

意识的算法解释

这个理论将「意识」从哲学和神秘主义的「困难问题」中解放出来。它认为:

意识不是什么神秘的天赐之物,它是一个高效数据压缩器在追求极致效率时,一个不可避免的算法副产品。

「自我」这个概念,只不过是你的压缩器为了给「我所有的经历」这个庞大、重复的数据集所找到的、最简短的「标签」。

启示与展望

这个理论在今天为什么如此重要?因为它不仅仅是关于人类心灵的理论,它更是关于**人工智能(AI)**未来的蓝图。

构建真正好奇的机器

我们目前的人工智能系统,通常需要「外部奖励」(比如「赢得这盘棋」或「识别这张图片」)才能学习。但在现实世界中,奖励(比如食物或危险信号)往往是极其稀疏的。

一个智能体如何在没有外部奖励的情况下,依然有动力去探索世界呢?

Schmidhuber 指出,虽然理论上存在「通用强化学习」算法,可以从零开始学习一切,但它们可能需要「巨大的」计算时间,才能从零开始发现「好奇心」这个概念是「有用」的。

解决方案:不要让 AI 从零开始学!

「压缩进步」驱动力是如此「通用且普遍有用」,以至于它「应该被预先植入(prewired),而不是从头学习」。

构建好奇机器的四步蓝图

Schmidhuber 为我们提供了一个清晰的、构建「好奇机器」的四步算法蓝图:

  1. 储存一切:像对待圣物一样,存储所有原始的行动和感官数据历史
  2. 改进主观可压缩性:持续运行一个压缩器(比如一个神经网络),试图在数据中找到新的、可压缩的规律
  3. 用压缩进步来奖励:每当压缩器变得更好(即它学会了用更少的比特来编码历史),就产生一个「内在奖励」信号
  4. 最大化内在奖励:使用一个强化学习器,来控制智能体的行动,使其主动寻求那些能带来最大内在奖励(即最陡峭的学习曲线)的新数据

一台以此为蓝图构建的 AI,将不再需要人类去设定「目标」。它会拥有自己的内在动机。

它会仅仅为了「学习的乐趣」(即获得「压缩进步」的算法奖励),而去主动地探索、实验、发现,并在这个过程中变得越来越智能。

对人类的启示

这一观点带来了许多发人深省的启示:

1. 培养兴趣的秘诀

如果我们想让学习和工作变得有趣,不妨为自己设定一些有挑战但又可实现的目标,让大脑保持在学习曲线陡升的阶段。

当你感觉倦怠无聊时,也许是因为你已经长时间没有接触新东西,没有体验到压缩进步的快感——是时候尝试学习一门新技能,或给自己找点新挑战了。

2. 教育的启发

「心流」状态存在于「未知但可知」的区域。教育者应该把握好这个度:

  • 太容易的内容让学生觉得无聊
  • 太难的内容让学生感到挫败
  • 恰到好处的挑战才能激发真正的兴趣

3. 理解创造力

我们的快乐不只是来自本能和欲望的满足,更来自对知识与模式的追寻。每当我们恍然大悟,都会体验到一刹那的幸福,那是因为我们的大脑找到了更简洁的方式看待世界。

在这个瞬间,我们既是严谨的科学家,又是敏锐的艺术家:我们发现了隐藏的规律,体会到主观美感的提升,同时又沉浸在有趣的新奇感中。

结语:拥抱好奇,享受压缩的乐趣

Schmidhuber 的「压缩进步」理论,用一个巧妙的角度串联起了好奇心、主观美感和创造力等看似迥异的心理体验。

从婴儿玩耍到科学巨擘的重大发现,从悠扬音乐到幽默笑话,我们看到了同一个底层机制在发挥作用:当我们的头脑发现新的可压缩模式时,我们会感到兴奋、愉悦,并被驱使着继续探索

这种源自进步本身的快乐,就是人类与生俱来的宝贵动力。

核心洞见

让我们回顾这个理论的核心洞见:

  • 是一个状态——你已经理解了某种模式的简洁之处
  • 有趣是一个过程——你正在获得新的理解
  • 好奇心是内在奖励机制——大脑对压缩进步的自我奖赏
  • 创造力是同一驱动力的不同表现——无论科学、艺术还是幽默
  • 意识是压缩的副产品——为「自我」这个重复出现的常量创建的内部符号

最后的思考

这不仅是一个解释了「啊哈!」时刻的理论;它本身,就是一个可能引领我们走向通用人工智能(AGI)的、「啊哈!」时刻。

总而言之,压缩进步理论为我们提供了一个统一的视角:科学与艺术是一枚硬币的两面,好奇心和美感是同一过程的不同阶段

我们会觉得某样东西美,是因为我们已经理解了它的模式;我们会觉得它有趣,则是因为我们尚在理解的路上。当理解完成,有趣变成美;当美遇上新的未知,又会转化出新的有趣。

人类就在这样的循环中不断进步,对世界的描述也愈加简洁明了。

那么,不妨让我们都保持一颗好奇之心,主动去发掘生活中那些「未知但可知」的领域。无论是学习新知识,还是培养新的爱好,每一次压缩进步都会点亮我们内心的奖赏回路

正是这无穷的好奇与求知欲,驱动我们超越平凡,体验发现的乐趣,创造出科学的奇迹和艺术的瑰宝。

毕竟,探索未知并将其化繁为简,是人类最有魅力的天性之一。

让我们拥抱这一天性,在追求知识与美的旅途中,不断享受「压缩进步」带来的惊喜与快乐吧!


参考资料

本文基于 Jürgen Schmidhuber 的开创性论文:

  • Schmidhuber, J. (2008). "Driven by Compression Progress: A Simple Principle Explains Essential Aspects of Subjective Beauty, Novelty, Surprise, Interestingness, Attention, Curiosity, Creativity, Art, Science, Music, Jokes." arXiv:0812.4360

论文链接:https://ar5iv.labs.arxiv.org/html/0812.4360


© 2025 智人飞扬