当前位置：首页 > 科技 > 正文

对未来十年（及更长时间）人工智能领域研究与发展的展望

启示号
科技
40秒前
64

熊墨淼( Xiong)

of and Data

of Texas, of

摘要

本文展望了人工智能研究的未来，重点关注整合神经科学的原理、提升人工智能与物理世界互动的能力，以及利用复杂流形结构的分析和生成数据的高级模型。我们将好奇心视为人工智能的首要原则，强调好奇心驱动智能过程，进而促成知识获取和问题解决。我们引入了包括预测编码、最小化自由能、信念更新和自组织在内的主动推理。此外，我们还讨论了神经人工智能（）和具身图灵测试（ Test）。图像、视觉、空间转录组学和单细胞组学都是高维数据，它们位于低维流形中。我们介绍了流形值变分自编码器（VAEs）、生成对抗网络（GANs）和扩散模型，这些工具被认为是流形拟合和分析的强大工具。最后，我们探讨了一种结合对抗训练和扩散模型的高级流形分析技术，以确保生成的数据准确反映底层流形结构。通过以结构保持约束来引导学习过程，模型在保持数据内在结构的同时，增强了数据生成的准确性。

智能的第一原则

对未来十年（及更长时间）人工智能领域研究与发展的展望

智能是一个创造、扩展和应用知识的过程。智能问题的根本在于好奇心。好奇心驱动了学习、探索、为感知世界的生成模型, 积累证据以及理解世界的欲望，从而促成了知识的获取和解决问题能力的发展。如果没有好奇心，智能将是静止的，因为不会有动力去寻找新信息或创新。因此，智能的首要原则通常被认为是好奇心。操作上，智能的第一原则可以通过主动推理和最小化感知与行动的自由能原则来实现（, 1994; Engel 2011; et al. 2024; et al. 2022）。

主动推理

主动推理是一个理论框架，用于描述包括人类在内的有机体如何感知、行动和学习其环境。它的基础是大脑是一个贝叶斯推理机器，持续更新对世界的信念以最小化惊奇或预测误差。

以下是主动推理的关键概念摘要：

1.预测编码大脑基于对世界的内部模型，持续生成关于感觉输入的预测。这些预测与实际的感觉数据进行比较，任何差异（预测误差）都会用于更新内部模型。这个过程有助于理解环境（van Zwol et al. 2024）。

2.最小化自由能主动推理基于最小化“自由能”的原则（Wei 2024），在此背景下，自由能指的是预测的感觉输入与实际感觉输入之间的差异。自由能在数学上与预测误差相关，最小化它确保了有机体的内部模型准确且高效。

3.行动与感知在主动推理中，行动与感知被视为一体的两面。为了最小化预测误差，有机体可以更新其内部模型（感知）或采取使世界更可预测的行动（行动）（Hohwy 2024）。例如，如果你期望看到某物但没有看到，你可能会移动眼睛或改变位置以更好地符合你的预期。

4.信念更新大脑根据感觉信息不断更新其信念或内部模型（Wilie et al. 2024）。这个过程是概率性的，意味着大脑在权衡不同的可能性后，基于最可能的情景更新其信念。

5.自组织与稳态主动推理还解释了有机体如何维持稳态（ et al. 2023）。通过采取最小化惊讶（或预测误差）的行动，有机体可以使其内部状态保持在可行范围内，确保生存。

6.应用主动推理已在神经科学、心理学、人工智能和机器人学等多个领域得到应用（ et al. 2024）。它为广泛的认知过程提供了统一的解释，从感知和学习到决策和运动控制。

综上所述，主动推理提供了一个全面的框架，帮助理解有机体如何与环境互动，不断调整其内部模型和行为，以最小化惊奇并保持稳定且功能正常的内部状态。

神经人工智能（Neuro AI）

主动推理基于一种仿生理论，包括神经科学启发的神经人工智能（Neuro AI）（Zador et al. 2023）。尽管人工智能取得了巨大进步，AI系统仍然缺乏与不可预测世界互动的基本能力。越来越多的人质疑，仅仅增加样本量是否能克服这些限制。越来越多的AI研究人员意识到，迫切需要从人脑和自然智能系统中汲取灵感的研究（Zador et al. 2023; et al. 2024）。

“”是指神经科学与人工智能（AI）交叉的研究领域。其目标是理解大脑的工作原理，并利用这些理解来改进AI系统。研究人员的目标包括：

理解大脑功能：通过研究人类大脑如何处理信息、学习和决策，研究人员希望发现可以应用于AI的原则。数学神经元模型最终可能会带来更强大的人工神经网络和更好的AI（Moore et al. 2024; Linka et al. 2023）。

开发仿生算法：利用神经科学的见解来创建模仿大脑功能的算法，如类似于神经元在大脑中连接和通信的神经网络（Han et al. 2023）。

通过生物学见解增强AI：通过融入大脑工作方式的元素，AI系统可以变得更加高效、适应性更强，并具备类似于人类的学习能力（ 2024）。

神经科学驱动的AI模型：一些研究集中于构建模拟特定大脑区域或认知过程的模型，这些模型可以用于开发更先进的AI系统（ et al. 2023）。

双向影响：虽然神经科学为AI提供了启发，AI也通过提供工具和模型来更好地理解大脑活动和认知过程，从而推动神经科学的发展（ and Zis 2019）。

具身图灵测试

最近，一些AI研究人员提出了具身AI的研究方向。他们认为具身AI是通用人工智能（AGI）的桥梁（Liu et al., 2024）。一组科学家提出用具身图灵测试取代经典的图灵测试（Zador et al., 2023），并将其视为的一大挑战。

人们通常使用艾伦·图灵提出的“模仿游戏”来测试机器是否具有类似人类的智能。具体而言，艾伦·图灵提出的原始图灵测试声称，如果测试者无法判断他们的对话伙伴是AI系统还是另一个真人，那么被测试的AI系统就通过了测试。图灵测试的最重要特点之一是其测试方法基于语言，侧重于对话信息。现代大型语言模型取得了重大进展，因此通过了图灵测试。然而，原始图灵测试有一个致命的缺陷：它将判断基于参与测试的人类与机器之间的语言对话。完全专注于对话能力忽视了机器是否具有思考能力的考察，而思考能力是智能最重要的特征。原始图灵测试暗示语言代表了人类智能的顶峰，因此假设能够进行对话的机器也必然具有智能。

然而，超出我们之前的想象，“大型语言模型”现在能够进行令人惊讶的连贯对话。在某种程度上，大型语言模型的成功揭示了我们多么容易被欺骗，自动地将智能、行为能力，甚至是意识归因于我们的对话伙伴。原始的图灵测试并没有考虑在真实物理世界中的思维和行动。它没有提供方法来揭示我们在真实世界环境中的智能能力，如感知、推理、规划和决策。人们越来越要求将原始图灵测试改为“具身图灵测试”。

“具身图灵测试”是英国数学家兼计算机科学家艾伦·图灵提出的原始图灵测试的扩展。原始图灵测试衡量的是机器展示出与人类相当或难以区分的智能行为的能力。在传统的图灵测试中，如果人类评估者无法可靠地区分人类和机器的回答，那么该机器就被认为通过了测试。

具身图灵测试：

具身图灵测试在这个概念上增加了一个额外的层次，要求AI或机器不仅在对话中表现出类似人类的智能，还要能够以类似人类的方式在物理世界中进行互动。

关键特征：

**物理存在：**与只涉及基于文本的互动的原始图灵测试不同，具身图灵测试要求AI具有一个能够与环境互动的物理形态（例如机器人）。

**感觉运动技能：**AI必须展示出通过传感器（如摄像头或麦克风）感知其周围环境，并以适当的物理动作（如移动物体、行走或手势）做出反应的能力。

**类似人类的行为：**AI的物理和对话行为应当与人类如此接近，以至于人类观察者无法区分他们是在与人类还是机器互动。

**AI与机器人技术的整合：**该测试结合了AI和机器人技术的进步，不仅测试认知能力，还测试在物理空间中执行需要协调、操作和实时决策的任务的能力。

目的：

具身图灵测试旨在通过挑战AI在思维和行动中展示出类似人类的智能，推动AI的边界。它作为评估AI发展的一个基准，检验AI是否能够像人类一样在现实世界中操作和互动。该测试对机器人技术、人机交互和AI伦理学等领域有重要意义。

总体而言，具身图灵测试提高了对机器“智能”的要求，不仅需要智力上的模仿，还需要物理化的体现和互动。

流形假设和流形学习

流形假设表明，高维数据（如图像或其他复杂数据类型）实际上位于高维空间内的一个低维流形上或靠近低维流形。这意味着即使数据可能有许多特征（维度），数据的内在结构实际上更简单，可以用更少的维度来表示。

想象一下你有一个非常高维的空间，比如一个有一千个维度的空间。这个空间中的每个数据点代表一个对象，如图像，具有成千上万个特征。流形假设提出，尽管维度很高，数据并没有随机地占据整个空间。相反，它存在于一个“流形”上，这个流形是嵌入在高维空间中的一个连续的、低维的曲面（如曲线或片状结构）。

例如，如果你处理的是面部图像，流形假设表明，所有可能的面部（这是高维数据）都位于一个低维流形上。这个流形捕捉了面部的基本特征，例如眼睛、鼻子和嘴巴的位置，同时舍弃了不相关的变化。

为了分析高维数据，我们需要开发新技术来揭示高维数据集的低维表示，同时保持点对点的距离（Yao et al. 2024）。深度学习方法如变分自编码器（VAE）、生成对抗网络（GAN）和扩散模型为流形嵌入、流形去噪、流形拟合和流形分析提供了强大的工具。

VAE包括两部分：编码器和解码器。编码器将输入数据映射到低维潜在空间中的分布中。这个潜在空间是数据流形预计所在的地方。然后解码器从这个潜在空间中采样一个点来重建数据。VAE通过学习潜在变量上的概率分布来将数据拟合到潜在空间中的平滑流形上。这有助于捕捉数据的内在结构。通过分析潜在空间，我们可以理解数据的底层结构。例如，在一个训练面部图像的VAE中，潜在空间中的不同方向可能对应于面部特征的变化，如嘴巴的宽度或头部的角度。

生成对抗网络（GAN）是另一种深度生成模型，通过将简单的、通常是低维的分布映射到一个与训练数据分布匹配的高维空间来生成新数据点。GAN由两个神经网络组成，它们彼此竞争：一个生成器和一个判别器。生成器从一个随机噪声向量（来自一个简单的分布，如高斯分布或均匀分布）开始，并将其映射到数据空间（如图像）。而判别器则尝试区分真实数据（来自训练集）和生成的数据（由生成器生成）。

这两个网络在博弈论框架下共同训练，其中生成器试图欺骗判别器，而判别器试图正确识别真实数据和虚假数据。随着时间的推移，生成器在生成与真实数据分布一致的现实数据方面不断提高。GAN通过将噪声向量（来自简单流形）映射到真实数据的复杂流形上，隐式地学习拟合数据分布。这种学习到的映射有助于生成与训练数据相似的新样本。将对抗性损失和循环一致性损失的总和作为模型的综合目标，GAN可以准确地拟合低维流形（Yao et al. 2024）。

“结构引导的扩散模型对抗训练”（Yang et al. 2024）是一种复杂的技术，它结合了对抗训练和扩散模型的原理，以增强生成位于复杂流形上的数据的能力。其主要思想是通过结构保持约束（通常由对抗机制提供信息）来引导扩散模型的学习过程，确保生成的数据准确反映训练数据的底层流形结构。

具体来说，该模型在训练过程中考虑了数据的流形结构。这可能涉及整合有关流形的先验知识，如局部或全局几何属性。对抗性组件帮助模型区分位于流形上的数据和不在流形上的数据。在这种设置中，判别器将对偏离学习到的流形的数据生成进行惩罚，引导扩散过程生成更准确的数据样本。通过整合结构引导的约束，扩散过程在减少噪声和“去噪”数据的过程中始终保持流形结构。

总之，“结构引导的扩散模型对抗训练”是一种强大的技术，通过结合对抗训练和结构保持约束，增强了扩散模型生成准确位于底层流形上的数据的能力。这种方法在需要保持数据内在结构的任务中尤其有用，如现实数据生成、鲁棒模型训练和流形探索。

参考文献

(1994). 'The of : A and .' , 116(1), 75-98.

Susan Engel (2011). The Mind: The of in . : Press.

Karl J et al. (2024). of from first . . 3(1): 1–19.

, P., , T., Çatal, O., , B. (2022). The Free for and : A Deep . 2022. 24: 301.

van Zwol B, R, van den Broek EL. (2024). and : and . arXiv:2407.04117.

Wei R. (2024). Value of and in and . arXiv:2408..

Hohwy J. (2024). Is error all there is to the mind?.

Wilie B, S, Ishii E, He J, Fung P. (2024). : The of Large .arXiv:2406.19764.

KJ. Et al. (2023). and . arXiv:2312..

, H, ć D, Grześ M. (2024). the Free : Four and a .arXiv:2402.14460.

Zador A. et al. (2024). next- . Nat 14, 1597 (2023).

S. et al. (2024). in : , , and . J . 271(5):2258-2273.

Moore JJ, A, M, Pughe- JL, de van RR, DB. (2024). The as a data- . Proc Natl Acad Sci U S A. 121(27):.

Linka K, SS, Kuhl E. (2023). model for human brain using . Acta 160: 134–151.

Han Y, Deng C, Huang GB. (2023). : Brain- and for next- AI: , and .Front . 17:.

, JJ, PR, E, C. (2023). of and the of -A . (Basel). 23(6):3062.

A, Zis P. (2019). , and acute pain: links and . Med. 131(7):438-444.

F. (2024). a model of the brain. eLife. 12:.

Liu Y, Chen W, Bai Y, Li G, Gao W, Lin L. (2024). Cyber Space with World: A on AI.arXiv:2407.06886.

Yao Z, Su J, and Yau ST. (2024). with . PNAS.121 (5) .

YangL, Qian H, Zhang Z, Liu J, Cui B. (2024). - of .arXiv:2402.17563.

排编：杨丽艳

你可能想看：

技术报告│智能电器的研究与发展

智能电网技术的基本特征是信息化、自动化和和互动化，智能电器是智能电网中能量流和信息流的控制节点。为智能电网的运行控制提供更加完善和丰富的数字化信息：二、智能电器的内涵和技术特征：能够实地获取各种运行和...

发展人工智能技术规矩不可少

两件与人工智能技术应用有关事件引发社会广泛关注。现在人工智能技术将这一复杂的技术过程简单化、快速化，人工智能技术将学生抬头、看手机、低头、记笔记、打瞌睡等行为进行统计标明。二是这类应用软件收集人脸信息...

中科院2019全球人工智能发展白皮书！八大关键技术中国崛起中

特别是在有效降低劳动成本、优化产品和服务、创造新市场和就业等方面为人类的生产和生活带来革命性的转变。中国科学院大数据挖掘与知识管理重点实验室发布了《2019年人工智能发展白皮书》。

镜鉴全球医疗器械巨头，迈瑞医疗未来十年还有多大空间？

迈瑞营收增长的主要动力还是来自于国内市场，对于一家想做高端市场的医疗器械公司，迈瑞多个产品做到了国内市场第一名和全球前几名。目前德尔格和GE两家国外品牌在国内占比合计超过 50%。体外诊断是公司第二大...

7款提高生产力的人工智能神器，免费还好用

一键生成手绘动画、一键视频换脸、智能合成PPT、智能生成视频片头......人工智能，顽兔抠图是阿里智能设计工作台中的一个功能，编辑界面可修复、可擦除、可设置去除/保留区域、可预览，AI配音、智能字幕...

人工智能能否改变生活

人工智能从理论、算法的突破到应用再到各行各业还有很长的路要走，但其与5G、机器视觉相结合应用在工业制造领域已较为成熟。他向记者分享了人工智能在工业和能源管理领域的应用示范，我们推出的智能工业视觉平台实...

溯因推理：人工智能的盲点

深度学习的最新进展重燃了人们对可以像人类一样思考和行动的机器或通用人工智能（AGI，我们将会向创造数字版的人类大脑不断迈进，所有证据都表明人类和机器智能完全不同。Why Computers Can’s...

陈根：人工智能：元宇宙的管理者

人工智能已成为新一轮科技革命和产业变革的重要驱动力量。以智能化的方式广泛联结各领域知识与技术能力。人工智能对各种应用场景的赋能不断改造着各个行业，需要更加成熟的人工智能技术的赋能内容生产，还需要通过人...

欧盟拟为“数字欧洲”计划拨付75亿欧元，聚焦超级计算与人工智能

美国信息技术和创新基金会发布《如何解决公共空间中增强现实的扩展引发的隐私问题》报告，ITIF发布《如何解决公共空间中增强现实（AR）扩展引发的隐私问题》报告，称增强现实（AR）设备连续实时地收集、分析...

人工智能时代下的法务合同审核

未来的法务合同审核工作应该是怎样的。需要对法务合同审核工作进行底层的剖析，法务审核合同是按照法律规定以及交易方之间的约定，审核合同是对已有的合同文本提出意见并确定最后拟签字的合同，法务进行合同审核，这...

人工智能各国战略解读系列之四《日本机器人新战略》

目前国际社会普遍推进机器人产业的发展，韩国于2014年发布了第二个职能机器人开发五年计划“2014年欧委会和欧洲机器人协会下属的180个公司及研发机构共同启动全球最大的民用机器人研发计划”日本政府希望...

智能手机最长可以用多长时间？

智能手机最脆弱的零部件是电池，电池的容量、快充问题直到今天都没有解决。手机寿命也因为电池寿命而大幅缩短。我们把手机电量从100%用到关机，不同规格的充电器也会对电池造成伤害，这种充电方法是非常伤害电池...

量子纠缠的具体机制之105：《人工意识app、人工意识产品的重大发现———对意识上传原理的哲学性研究》

从而拉开了人工意识、人工灵魂、人工元神、意识上传、灵魂永生、元神出窍、人工躯体、脑机接口等人体科学技术、量子信息技术和人工意识技术革命的大序幕！人工意识app是人类意识的物质化、产品化、信息化、程序化...

中国智库 >> 智库研究文章 >> [刘助仁]国际智库的现状与发展趋势

本文拟对国际智库的发展现状、主要类型、发展趋势作一介绍，一、国际智库的发展现状当今世界各国都有类似智库的智力机构。它们以咨询研究的针对性、时效性适应于政府、社会团体决策者科学决策的需求，国际上各种...

浅谈家庭教育对孩子未来发展的影响（上）（下待续）

浅谈家庭教育对孩子未来发展的影响，你的言传身教对孩子未来的成长与发展又起着不可磨灭的作用。这也就是我们今天要面对的家庭教育对孩子未来发展的影响课题的剖析，正确与错误的家庭教育观念与方法会对孩子的心智，...

元宇宙的智能进化：智能的“人”与智能的“环境”

部分AI企业已经将元宇宙视作一个新的。智能交互、陪伴等功能都会是最先被提到的内容”还是电影《Her》中的善解人意的人工智能系统萨曼莎”在元宇宙时代AI虚拟人将接替移动互联网时代APP的作用”AI虚拟人...

我所理解的价值投资价值投资是以金钱、时间、精力等资源参与到长期来看有利于人类社会发展的事业中去，与...

价值投资是以金钱、时间、精力等资源参与到长期来看有利于人类社会发展的事业中去，正视风险、实事求是地形成投资策略，正视风险和实事求是是价值投资的核心思想。一个事业（行业）、一个企业组织及产品是否有利于人...

大温脾丸及其类方的研究与运用（九）

现在马上进入比较精彩的部分，可能我认识的人当中，本身就不是一个系统的完整地观察中医的角度。甚至人体和天地宇宙的观察角度，因为我们古人就用的这个视角去看待我们的生命。那么现在医学认为，是我经常解方的一种...

如何长时间高效学习？

算是期末考试周到来前送给大家的礼物吧~相信不会让你失望的。以前你可能已经看过很多讲学习方法的文章“今天这篇文章会讲到很多学习方法，我会先阐述它们在学习的过程中起到了什么样的作用，第二部分介绍学习前的准...

再发一本好书《中医治愈奇病集成》，用了很长时间，pdf转过来的

用了很长时间才转换和校对成DOC格式，按我的排版，谁要是打印，为防止出错，请先打印目录部分，然后把目录删除，变成空白页（保证正文页码不变）再打印正文。因为后缀是z01上传不了，不得不将《中医治愈奇病集...

软件定义卫星技术发展与展望

软件定义卫星是以天基超算平台和星载操作环境为基础的新一代开放架构的卫星系统。文中从需求分析、国内外研究现状、软件定义卫星的概念内涵、体系架构和关键技术、发展设想等方面进行了分析和论述，通过软件定义卫星...

2020年前沿科技发展态势及2021年趋势展望——信息篇

尤其计划大幅增加人工智能和量子信息科学等未来产业的研发投资，在全美范围内设立12个新的人工智能和量子信息科学研究机构，旨在让美国在人工智能和量子技术方面保持全球竞争力，德国政府决定对2018年版的《人...

中国氢能源行业市场现状及发展趋势分析未来政策将推动绿氢快速发展氢能源行业主要上市公司：目前国内氢...

氢能源行业主要上市公司：目前国内氢能源行业的上市公司主要有(600028)、(002274)、(01907.HK)、(002221)、卫星石化(002648)、(06885.HK)、(002002)、...

《3-6岁儿童学习与发展指南》全文

最大限度地支持和满足幼儿通过直接感知、实际操作和亲身体验获取经验的需要，通过提出3-6岁各年龄段儿童学习与发展目标和相应的教育建议，帮助幼儿园教师和家长了解3-6岁幼儿学习与发展的基本规律和特点，建立...

主题活动中的幼儿学习与发展评价

幼儿作为活动主体在这个过程中逐步建构知识、学习技能、积累经验、获得发展。其教学目标的达成应通过活动中幼儿获得的真实学习与发展来加以确定。这些幼儿园课程评价模式均强调要根据幼儿在真实而有意义情境中的实际...

人文素养与发展

某省公众的人文社会科学素养，人文素养反映了一个人的基本修养与品质；体现了人们处理人与自然、人与社会、人与人之间关系的价值观，缺乏人文素养、失落人文精神；必然会制约个人乃至社会、国家、民族的可持续发展，...

当民间中医遇上神农传人︱第四辑·灵芝演变与发展（4）

灵芝生长分阶段?灵芝整个生长的过程分为不同的阶段：灵芝生长在丛林下枯枝落叶旁边，灵芝的子实体发育的最适温度是25℃~28℃。在长灵芝的地下土壤里铺了一层白丝状的东西，它只能长在土壤里面或者树根上面，所...

人工智能未来展望主动推理流形值变分自编码器

上一篇
盆景的色彩构成（一）

下一篇
澳门49图库app软件下载

对未来十年（及更长时间）人工智能领域研究与发展的展望

最新文章

澳门49图库app软件下载

上海周边泡温泉好去处周末相约走起(图)

澳门49图库app下载

天星十二穴

自创动物励志篇（图片来源于网络，文字为原创）

鼻中隔偏曲、鼻窦炎手术及术后恢复记录

office 2010最新永久激活密钥以及激活方法

涨知识：什么是碳达峰和碳中和？中国将用最短时间实现碳中和

热门文章

欣赏丨世界著名的60幅女人体油画，裸露但不低俗~

小六壬完整解释

小六壬神断口诀大全，掐指一算直断生死！

亲戚关系图（关于中国亲戚称谓）家庭称谓大全，再也不用担心叫错了称呼

中国地图经纬度（中国地图同纬度城市大全）

医学界：女人生殖器高清组图大集合

存钱三大忌口诀？

农村礼仪：二十四拜，花式二十四拜基本走法图解