社区

学习

工具库

AI工具

休闲

简体中文

目录

两大基本原则：简约与自洽

通用学习引擎

首页

科技周边

人工智能

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

王林

Apr 18, 2023 pm 12:52 PM

人工智能计算框架智能系统

人工智能发展七十年，虽然技术指标上不断刷新，但到底什么是「智能」，它如何出现及发展的，还没有答案。

最近马毅教授联手计算机科学家沈向洋博士、神经科学家曹颖教授发表了一篇对智能出现及发展的研究综述，希望将智能体的研究在理论上统一起来，增进对人工智能模型的理解与可解释性。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

论文链接：http://arxiv.org/abs/2207.04630

文中引入了两个基本原则：简约（Parsimony）与自洽（ Self-consistency）。

作者认为这是智力、人工或自然的兴起的基石。尽管在经典文献里，对这两个原则各自的相关论述、阐述众多，但本文对这两个原则以完全可度量和可计算的方式重新进行解读。

基于这两个第一性的原则，作者推演出了一个高效的计算框架：压缩闭环转录，该框架统一并解释了现代深度网络和许多人工智能实践的演变。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

两大基本原则：简约与自洽

在深度学习加持下，过去十年人工智能取得的进展主要依赖于训练同质化的黑箱模型，使用粗暴的工程方法训练大规模神经网络。

虽然性能提高了，也无需手动设计特征，但神经网络内部学到的特征表示却是不可解释的，并且大模型带来其他的难题，比如不断提高的数据收集和计算的成本、学到的表征缺乏丰富性、稳定性（模式崩溃）、适应性（容易出现灾难性遗忘）；对变形或对抗性攻击缺乏稳健性等。

作者认为，目前在深度网络和人工智能的实践中出现这些问题的根本原因之一是对智能系统的功能和组织原则缺乏系统和综合的理解。

举个例子，训练用于分类的判别式模型和用于采样或重放的生成性模型基本上在实践中是分开的。这样训练的模型通常叫开环系统，需要通过监督或自监督进行端到端的训练。

在控制理论中，这种开环系统（open-loop systems）不能自动纠正预测中的错误，而且对环境的变化没有适应性；正是因为这样的问题，在控制系统（controlled systems）中大家广泛采用「闭环反馈」，使系统能够自主纠正错误。

类似的经验在学习中也适用：一旦判别式模型和生成性模型结合在一起，形成一个完整的闭环系统，学习就可以变得自主（无需外部监督），而且更有效率、更稳定、更有适应性。

为了理解智能系统中可能需要的功能组件，如判别器或生成器等部件，我们需要从一个更加「原则」和「统一」的角度来理解智能。

文中提出两个基本原则：简约（Parsimony）和自洽（Self-consistency），分别回答了关于学习的两个基本问题。

学什么：要从数据中学习什么，如何衡量学到的好坏？

怎么学：我们如何通过高效和有效的计算框架来实现这样一个学习的目标？

对于第一个「学什么」的问题，简约原则认为：

智能系统的学习目标就是从外部世界的观测数据中找出低维的结构，并且以最紧凑和结构化的方式重新组织和表示它们。

这也就是「奥卡姆剃刀」原则：如无必要，勿增实体。

如果没有这一原则，智能就不可能发生与存在！如果对外部世界的观测数据没有低维结构，就没有什么值得学习或记忆的东西，也就无法进行良好的泛化或预测。

而且智能系统需要尽量节省资源，如能量、空间、时间和物质等，在某些情况下，该原则也被称为「压缩原则」。但是，智能的简约性（Parsimony of Intelligence）并不是要实现最好的压缩，而是要通过高效的计算手段获得观测数据最紧凑和结构化的表达。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

那么简约性该如何度量？

对于一般的高维模型来说，许多常用的数学或统计学「度量」的计算成本都是指数级的，或者对于有低维结构的数据分布来说，甚至是没有定义的，比如最大似然、KL分歧、互信息、Jensen-Shannon和Wasserstein距离等。

作者认为学习的目的实际上就是建立一个映射（通常是非线性的），从原始高维输入中得到一个低维的表示。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

这样，得到的特征z的分布应该更加紧凑和结构化；紧凑意味着存储上更经济；结构化意味着访问和使用更加高效：特别是线性结构，是内插或外推的理想选择。

为了这个目的，作者引入了线性判别表示（LDR），实现三个子目标：

压缩：将高维感官数据x映射到低维表征z；
线性化：将分布在非线性子面的每一类物体映射到线性子空间；
稀疏化：将不同类别映射到相互独立或最不相关的子空间。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

而这几个目标可以通过最大编码率减少（rate reduction）来实现，保证所学到的LDR模型具有最优的简约性能。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

对于第二个「怎么学」的问题，自洽原则认为：

一个自主的智能系统通过最小化观测到的数据和再生成的数据在内部表达中的差异，为外部世界的观测寻求一个最自洽的模型。

仅仅是简约原则并不能确保学到的模型能够捕捉到关于外部世界的数据中的所有重要信息。例如，通过最小化交叉熵，将每个类别映射到一个一维的one-hot向量，可以被看作是简约性的一种形式。

它可能会学到一个好的分类器，但学到的特征也可能会崩溃成一个singleton，也称为神经崩溃。这样学到的特征将不再包含足够的信息来重新生成原始数据。

即使我们考虑更普遍的LDR模型，仅靠最大化编码率差也不能自动确定环境特征空间的正确维度。

如果特征空间的维度太低，学到的模型就会与数据不匹配；如果太高，模型可能会过度匹配。

更一般地说，我们认为感知的学习不同于学习具体任务。感知的目标是学习关于所感知的一切可预测的内容。

就像爱因斯坦所说过的：「事情应该力求简单，不过不能过于简单。」

通用学习引擎

基于这两个原则，文章以视觉图像数据建模为例推导出了压缩闭环转录框架（compressive closed-loop transcription framework）。

其通过比较和最小化内部表征的差异，在内部对非线性数据子流型进行压缩式闭环转录，以实现LDR。

编码器/传感器和解码器/控制器之间的追逃游戏，可以让解码表征生成的数据的分布追逐和匹配观察到的真实数据分布。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

另外作者指出，压缩式闭环转录可以有效地进行增量学习。

一个新的数据类的LDR模型可以通过编码器和解码器之间的一个有约束的博弈来学习的：过去学习到的类的记忆可以很自然地作为博弈中的约束被保留，也就是作为闭环转录的「固定点」。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

文中还对这个框架的普适性提出了更多的推测性想法，将其扩展到三维视觉和强化学习，并预测其对神经科学、数学和高级智能的影响。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

通过这个由第一性原理推导出来的框架：信息编码理论、闭环反馈控制、优化/深度网络和博弈论的概念都有机地整合在一起，成为一个完整的、自主的智能系统的必要组成部分。

70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」

值得一提的是，压缩闭环式架构在自然界的所有智能生物以及不同尺度上无处不在：从大脑（压缩感知信息），到脊柱回路（压缩肌肉运动），直至DNA（压缩蛋白质的功能信息）等等。

所以作者认为，压缩性闭环转录应该是所有智能行为背后的「通用学习引擎」。它使得自然的或者人工的智能系统能够从看似复杂的感知数据中发现并提炼出低维的结构，把它们转换为简洁规则的内部表达，以利于将来正确地判断和预测外部世界。

这是一切智能发生和发展的计算基础和机理。

参考资料：http://arxiv.org/abs/2207.04630

以上是70年AI发展迎来大一统？马毅、曹颖、沈向洋最新AI综述：探索智能发生的基本原则与「标准模型」的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

显示更多

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前 By DDD

R.E.P.O.如果您听不到任何人，如何修复音频

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.聊天命令以及如何使用它们

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

显示更多

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7523

15

CakePHP 教程

1378

52

steam的账户名称是什么格式

81

11

win11激活密钥永久

54

19

NYT连接提示和答案

21

74

显示更多

Related knowledge

我尝试了使用光标AI编码的Vibe编码，这太神奇了！

我尝试了使用光标AI编码的Vibe编码，这太神奇了！ Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发，这种创新的方法使Dev

2025年2月的Genai推出前5名：GPT-4.5，Grok-3等！

2025年2月的Genai推出前5名：GPT-4.5，Grok-3等！ Mar 22, 2025 am 10:58 AM

2025年2月，Generative AI又是一个改变游戏规则的月份，为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测？

如何使用Yolo V12进行对象检测？ Mar 22, 2025 am 11:07 AM

Yolo（您只看一次）一直是领先的实时对象检测框架，每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步，可显着提高准确性

Chatgpt 4 o可用吗？

Chatgpt 4 o可用吗？ Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用，与诸如ChatGpt 3.5（例如ChatGpt 3.5）相比，在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

最佳AI艺术生成器（免费付款）创意项目

最佳AI艺术生成器（免费付款）创意项目 Apr 02, 2025 pm 06:10 PM

本文回顾了AI最高的艺术生成器，讨论了他们的功能，对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值，并建议使用Dall-E 2进行高质量的可定制艺术。

O1 vs GPT-4O：OpenAI的新型号比GPT-4O好吗？

O1 vs GPT-4O：OpenAI的新型号比GPT-4O好吗？ Mar 16, 2025 am 11:47 AM

Openai的O1：为期12天的礼物狂欢始于他们迄今为止最强大的模型 12月的到来带来了全球放缓，世界某些地区的雪花放缓，但Openai才刚刚开始。山姆·奥特曼（Sam Altman）和他的团队正在推出12天的礼物前

Google的Gencast：Gencast Mini Demo的天气预报

Google的Gencast：Gencast Mini Demo的天气预报 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast：天气预报的革命性AI 天气预报经历了巨大的转变，从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast，开创性

哪个AI比Chatgpt更好？

哪个AI比Chatgpt更好？ Mar 18, 2025 pm 06:05 PM

本文讨论了AI模型超过Chatgpt，例如Lamda，Llama和Grok，突出了它们在准确性，理解和行业影响方面的优势。（159个字符）

See all articles