对具身人工智能的呼吁

文章倡导将具身人工智能（E-AI）作为迈向通用人工智能（AGI）的关键步骤，并强调了E-AI相较于当前的人工智能进步，如大型语言模型（LLMs），在实现具备感知、行动、记忆和学习能力的智能体方面的必要性和理论框架。论文题目： A call for embodied AI论文链接： https://arxiv.org/abs/2402.03824PS: 欢迎大家扫码关注公众号，我们一起在AI的世界中

hanscal

936人浏览 · 2024-10-20 23:14:46

hanscal · 2024-10-20 23:14:46 发布

论文呼吁将具身人工智能（Embodied AI, E-AI）作为实现通用人工智能（AGI）的重要路径，区别于目前主流的大型语言模型（LLMs）。论文指出，真正的智能源于与环境的交互，而不仅仅是静态的数据处理。E-AI强调的是从感知、行动、记忆和学习等多个方面来构建智能体，这一框架与Friston的主动推断原则相吻合，旨在推动E-AI的发展。然而，E-AI也面临着诸多挑战，包括需要建立新的学习理论以填补监督学习和强化学习之间的空白，同时还需要创新高效的硬件解决方案。尽管存在挑战，E-AI有潜力革新我们与技术的交互方式，并促进AI在物理世界和人类社会中的理解和参与度。
在这里插入图片描述

1 具身人工智能

具身智能（Embodied AI，简称E-AI）是指一类人工智能子领域，它专注于创建能够与其物理环境进行交互的智能体，强调感观运动耦合和情境化智能。与仅仅被动观察环境不同，具身智能体能够作用于其环境，并从环境的反应中学习。具身智能深深植根于具身认知理论，这是一种哲学和认知科学的观点，它认为心智和身体之间存在着密切的联系，反对传统的心物二元论，即那种将心智和身体截然分开的观点。具身认知理论认为理性并不是基于抽象法则，而是源于身体的经验。

在人工智能领域，对于具身性的探索始于20世纪80年代，当时人们逐渐意识到无身体智能体（disembodied agents）的内在局限性，主要归因于这些智能体缺乏与环境进行丰富、高带宽交互的能力。具身智能的重点在于实现“具身”和“活动”（enactive）的方面，而“嵌入”和“扩展”的部分更多地涉及将人工智能置于社会背景中，并作为增强个体或集体人类认知的一部分。

1. 理论框架

具身化对于人工智能而言至关重要，因为它允许智能体通过与环境的实际互动来学习和发展技能，这种直接体验能促进更自然的适应能力和泛化能力。此外，具身智能体可以更好地理解其环境中的对象及其可用性，从而使其行为更加符合实际情况并且更具意义。

感知与行动：E-AI强调智能体不仅要能够感知周围环境，还要能够通过自身的行动与环境产生互动，这种互动对于学习至关重要。
认知架构：借鉴认知科学家设计的认知架构，E-AI集成了诸如记忆、学习等关键组件，旨在模仿人脑的工作方式。
主动推理：E-AI的原理与Friston提出的主动推理原则相一致，智能体通过内部模型预测结果，并不断更新模型，同时积极地改变环境以匹配其预期。
内在动机机制：为了鼓励智能体探索未知，减少不确定性，E-AI的设计中包含了激励机制，使智能体具有内在的学习动力。
动态数据处理：不同于传统的学习理论，E-AI需要一种新的学习理论，以处理智能体与不断变化的环境互动过程中产生的动态数据。

2. 存在挑战

新的学习理论：需要开发新的学习理论，以弥合监督学习与强化学习之间的差距。传统的学习理论假设数据是从固定分布中抽取的，而这与具身智能体在不断变化的环境中获取非平稳数据的情况不符。
感知与行动中的噪声管理：在感知和行动过程中有效地管理和安全地处理噪声是一个挑战。具身智能体需要在不完美信息条件下做出决策，并确保这些决策的安全性。
第一人称视角的转变：具身智能体倾向于采取第一人称视角（egocentric perspective），这与当前大多数AI系统采用的第三人称视角（allocentric perspective）不同。这种视角的变化是为了让智能体更加专注于其周围的直接环境，但同时也带来了技术和理论上的新挑战。
伦理标准下的有效沟通：确保具身智能体能够按照伦理标准与人类进行有意义的沟通，这也是一个重要的挑战。随着具身智能体与人类社会的互动日益增多，如何设计出既安全又符合伦理要求的沟通机制成为了一个关键问题。

2 结语

文章倡导将具身人工智能（E-AI）作为迈向通用人工智能（AGI）的关键步骤，并强调了E-AI相较于当前的人工智能进步，如大型语言模型（LLMs），在实现具备感知、行动、记忆和学习能力的智能体方面的必要性和理论框架。

论文题目： A call for embodied AI

论文链接： https://arxiv.org/abs/2402.03824

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！
在这里插入图片描述

NVIDIA AI技术专区

NVIDIA官方入驻，分享最新的官方资源以及活动/会议信息，精选收录AI相关技术内容，欢迎大家加入社区并参与讨论。

更多推荐

16_Vue3动画(一)之动画的基本使用及animate.css库的使用

Vue3动画的基本使用及animate.css库的使用认识动画在开发中，我们想要给一个组件的显示和消失添加某种过渡动画，可以很好的增加用户体验：React框架本身并没有提供任何动画相关的API，所以在React中使用过渡动画我们需要使用一个第三方库react-transition-group；Vue中为我们提供一些内置组件和对应的API来完成动画，利用它们我们可以方便的实现过渡动画效果；我们来看一