论文呼吁将具身人工智能(Embodied AI, E-AI)作为实现通用人工智能(AGI)的重要路径,区别于目前主流的大型语言模型(LLMs)。论文指出,真正的智能源于与环境的交互,而不仅仅是静态的数据处理。E-AI强调的是从感知、行动、记忆和学习等多个方面来构建智能体,这一框架与Friston的主动推断原则相吻合,旨在推动E-AI的发展。然而,E-AI也面临着诸多挑战,包括需要建立新的学习理论以填补监督学习和强化学习之间的空白,同时还需要创新高效的硬件解决方案。尽管存在挑战,E-AI有潜力革新我们与技术的交互方式,并促进AI在物理世界和人类社会中的理解和参与度。
在这里插入图片描述

1 具身人工智能

具身智能(Embodied AI,简称E-AI)是指一类人工智能子领域,它专注于创建能够与其物理环境进行交互的智能体,强调感观运动耦合和情境化智能。与仅仅被动观察环境不同,具身智能体能够作用于其环境,并从环境的反应中学习。具身智能深深植根于具身认知理论,这是一种哲学和认知科学的观点,它认为心智和身体之间存在着密切的联系,反对传统的心物二元论,即那种将心智和身体截然分开的观点。具身认知理论认为理性并不是基于抽象法则,而是源于身体的经验。

在人工智能领域,对于具身性的探索始于20世纪80年代,当时人们逐渐意识到无身体智能体(disembodied agents)的内在局限性,主要归因于这些智能体缺乏与环境进行丰富、高带宽交互的能力。具身智能的重点在于实现“具身”和“活动”(enactive)的方面,而“嵌入”和“扩展”的部分更多地涉及将人工智能置于社会背景中,并作为增强个体或集体人类认知的一部分。

1. 理论框架

具身化对于人工智能而言至关重要,因为它允许智能体通过与环境的实际互动来学习和发展技能,这种直接体验能促进更自然的适应能力和泛化能力。此外,具身智能体可以更好地理解其环境中的对象及其可用性,从而使其行为更加符合实际情况并且更具意义。

  • 感知与行动:E-AI强调智能体不仅要能够感知周围环境,还要能够通过自身的行动与环境产生互动,这种互动对于学习至关重要。

  • 认知架构:借鉴认知科学家设计的认知架构,E-AI集成了诸如记忆、学习等关键组件,旨在模仿人脑的工作方式。

  • 主动推理:E-AI的原理与Friston提出的主动推理原则相一致,智能体通过内部模型预测结果,并不断更新模型,同时积极地改变环境以匹配其预期。

  • 内在动机机制:为了鼓励智能体探索未知,减少不确定性,E-AI的设计中包含了激励机制,使智能体具有内在的学习动力。

  • 动态数据处理:不同于传统的学习理论,E-AI需要一种新的学习理论,以处理智能体与不断变化的环境互动过程中产生的动态数据。

2. 存在挑战

  • 新的学习理论:需要开发新的学习理论,以弥合监督学习与强化学习之间的差距。传统的学习理论假设数据是从固定分布中抽取的,而这与具身智能体在不断变化的环境中获取非平稳数据的情况不符。

  • 感知与行动中的噪声管理:在感知和行动过程中有效地管理和安全地处理噪声是一个挑战。具身智能体需要在不完美信息条件下做出决策,并确保这些决策的安全性。

  • 第一人称视角的转变:具身智能体倾向于采取第一人称视角(egocentric perspective),这与当前大多数AI系统采用的第三人称视角(allocentric perspective)不同。这种视角的变化是为了让智能体更加专注于其周围的直接环境,但同时也带来了技术和理论上的新挑战。

  • 伦理标准下的有效沟通:确保具身智能体能够按照伦理标准与人类进行有意义的沟通,这也是一个重要的挑战。随着具身智能体与人类社会的互动日益增多,如何设计出既安全又符合伦理要求的沟通机制成为了一个关键问题。

2 结语

文章倡导将具身人工智能(E-AI)作为迈向通用人工智能(AGI)的关键步骤,并强调了E-AI相较于当前的人工智能进步,如大型语言模型(LLMs),在实现具备感知、行动、记忆和学习能力的智能体方面的必要性和理论框架。

论文题目: A call for embodied AI

论文链接: https://arxiv.org/abs/2402.03824

PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!
在这里插入图片描述

Logo

NVIDIA官方入驻,分享最新的官方资源以及活动/会议信息,精选收录AI相关技术内容,欢迎大家加入社区并参与讨论。

更多推荐