您的位置:首页>知识>

模拟与现实世界的差距

导读2022年1月18日整理发布:简而言之,这篇论文证明,如果你可以创建一个足够复杂的环境,设计正确的强化学习架构,并让你的模型有足够的经验(

2022年1月18日整理发布:简而言之,这篇论文证明,如果你可以创建一个足够复杂的环境,设计正确的强化学习架构,并让你的模型有足够的经验(并且有很多钱可以花在计算资源上),你将能够泛化到同一环境中的各种任务。这基本上就是自然进化赋予人类和动物智慧的方式。

事实上,DeepMind 已经用AlphaZero做了类似的事情,这是一种强化学习模型,能够成功掌握多个两人回合制游戏。Xland 实验通过添加零样本学习元素将相同的概念扩展到更高的水平。

但是,虽然我认为 XLand 训练的代理的经验最终将转移到机器人和自动驾驶汽车等现实世界的应用中,但我认为这不会是一个突破。您仍然需要做出妥协(例如创建人为限制以降低现实世界的复杂性)或创建人为增强功能(例如为机器学习模型注入先验知识或额外的传感器)。

DeepMind 的强化学习代理可能已经成为虚拟 Xland 的主人。但他们的模拟世界甚至没有现实世界的复杂性的一小部分。这种差距在很长一段时间内仍将是一个挑战。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。