谷歌发现了一种帮助机器人处理现实世界开放式复杂性的新方法:教它们如何理解语言。
这家科技巨头将其处理语言的最新人工智能技术PaLM移植到母公司Alphabet旗下的实验部门之一“日常机器人”(Everyday robots)的机器人上。周二,该公司公布了这项名为PaLM-SayCan的技术。
通过这项技术,谷歌的人工智能语言模型带来了足够的现实世界知识,以帮助机器人解释人类模糊的命令,并将一系列动作串联起来做出回应。这与大多数机器人在严格控制的情况下(比如在汽车装配线上安装挡风玻璃)遵循的精确脚本动作形成了鲜明的对比。
这项技术是一项已经准备就绪的研究项目。天辰注册网址但谷歌一直在一个实际的办公室厨房中测试它,而不是在一个更可控的实验室环境中,努力制造出可以在我们实际生活中不可预测的混乱中有用的机器人。与特斯拉的两足机器人擎天柱、波士顿动力公司的作品和亚马逊的Astro一样,它展示了机器人最终将如何走出科幻小说。
当谷歌AI研究人员对PaLM-SayCan机器人说:“我把饮料洒了,你能帮忙吗?”它就会通过轮子在谷歌办公大楼的厨房里滑行,用数码相机的视觉看到柜台上的一块海绵,然后用机械手臂抓住它,把它带回给研究人员。机器人还能识别百事可乐和可口可乐,打开抽屉并找到薯片袋。借助PaLM的抽象能力,它甚至可以理解黄色、绿色和蓝色的碗分别代表沙漠、丛林和海洋。
谷歌的高级研究科学家卡罗尔·豪斯曼(Karol Hausman)参与了这项技术的演示,他说:“随着我们改进语言模型,机器人的性能也会提高。”