图灵奖获得者Yann LeCun :学习“世界模型”的能力是构建人类级AI的关键...
发布网友
发布时间:2024-10-09 12:01
我来回答
共1个回答
热心网友
时间:2024-11-14 09:15
构建接近人类水平的人工智能需要什么?仅仅是更多的数据和更大的人工智能模型吗?
本文通过深入探讨人工智能专家Yann LeCun的见解,揭示了构建人类级AI的关键所在:学习“世界模型”的能力。LeCun认为,一个从未接触过驾驶的青少年能在短短20小时内学会开车,而当前的自动驾驶系统,尽管需要数百万甚至数十亿的带标签训练数据和强化学习试验,仍无法像人类一样可靠。因此,构建能与人类媲美的AI,关键在于其能否学习和理解世界运行的内部模型。
“人类和非人类动物似乎能够通过观察和少量难以理解的互动,以一种与任务无关的、无监督的方式学习关于世界如何运作的大量背景知识。根据推测,这样积累的知识可能就构成了我们通常所说的常识的基础。”LeCun指出。
这使得动物不仅能够预测未来结果,而且能够填补缺失的信息,无论是时间上的还是空间上的。人类使用世界模型的能力,使我们在不熟悉的情况下仍能高效地规划和执行任务。例如,一个从未在雪地开过车的司机,通过常识知道雪地会很滑,从而在驾驶时采取相应的安全措施。
人工智能系统使用世界模型的想法可以追溯到几十年前的心理学和工程领域,如控制与机器人学。LeCun强调,当今人工智能最重要的挑战之一是设计学习范式和架构,使机器能够以自监督的方式学习世界模型,然后使用这些模型进行预测、推理和规划。
为了实现这一目标,LeCun提出了一种自主智能架构,该架构由六个独立的模块组成。这些模块包括配置器、感知模块、世界模型、成本模块、行为者模块和短期记忆模块。配置器负责执行控制,感知模块接收传感器信号并估计世界状态,世界模型模块评估感知未能提供的信息并预测未来状态,成本模块计算不适程度,行为者模块计算行动建议,短期记忆模块记录当前和预测的世界状态。
LeCun还讨论了预测性世界模型的核心挑战,即如何使模型能够代表多种多样的合理预测。现实世界是不可完全预测的,需要模型具备抽象表示能力,保留重要细节信息,忽略不相关信息,并在抽象表示的空间内进行预测。
通过联合嵌入预测架构(JEPA)和正则化方法,模型可以自然生成信息性抽象表示,去除不相关细节,并进行预测。这使得模型可以分层预测,从高层次的抽象描述到较低层次的精确预测。
LeCun指出,分层JEPA可以通过观察和与环境互动学习世界的运行方式,训练自己预测视频中会发生什么,生成世界的分层表示,并通过采取行动并观察结果来学习预测行动后果,进行推理和规划。
通过适当的训练,将分层JEPA转变成世界模型,代理可以对复杂的行动进行分层规划,将任务分解成一系列不太复杂、不太抽象的子任务,直至效应器上的底层行动。这种感知-行动过程涉及从高层次到较低层次的多次预测和优化。
构建这样的模型需要克服许多挑战,包括实例化世界模型的架构和训练过程、精确训练批评者、构建和训练配置器、使用短期记忆优化批评者等。LeCun及其团队期待在未来几个月和几年内探索这些问题,并与该领域的其他人交流想法、相互学习。
尽管构建人类级AI的挑战巨大,但通过深入研究和不断努力,我们有望加深对思维和机器的理解,使AI用户从中受益。人工智能正朝着能够有效学习和理解的机器迈进,但成功需要长期的科学努力。