1月8日消息,据外媒报道,DeepMind机器人团队公布了三项新进展,称这些进展将帮助机器人在野外做出更快、更好、更安全的决策。其中一个包括一个收集训练数据的“机器人宪法”系统,以确保你的机器人办公室助理可以为你取更多的打印纸,但不会撞倒碰巧挡道的人类同事。
谷歌的数据收集系统auort可以使用视觉语言模型(VLM)和大型语言模型(LLM)协同工作,以了解其环境,适应不熟悉的环境,并决定适当的任务。机器人宪法的灵感来自Isaac Asimov的“机器人三定律”,它被描述为一组“以安全为重点的提示”,指示LLM避免选择涉及人类、动物、尖锐物体甚至电器的任务。
为了提高安全性,DeepMind对机器人进行了编程,使其在关节受力超过一定阈值时自动停止,并安装了一个物理终止开关,操作人员可以使用它来关闭机器人。在七个月的时间里,谷歌在四座不同的办公楼部署了53个auort机器人,进行了77000多次试验。一些机器人由人类操作员远程控制,而其他机器人则根据脚本或完全自主地使用谷歌的机器人变压器(RT-2)人工智能学习模型进行操作。
试验中使用的机器人看起来更实用,只配备了一个摄像头、机械臂和移动基座。“对于每个机器人,系统使用VLM来了解其环境和视线内的物体。接下来,LLM会提出一系列机器人可以执行的创造性任务,比如‘把零食放在台面上’,并扮演决策者的角色,为机器人选择合适的任务。”
DeepMind的其他新技术包括SARA-RT,这是一种神经网络架构,旨在使现有的机器人变压器RT-2更准确、更快。该公司还宣布了RT-Trajectory技术,该技术添加了2D轮廓功能,以帮助机器人更好地执行擦桌子等特定物理任务。