Google母公司Alphabet为机器人扩展语言能力,可以更好地理解人类指令
近日,据海外媒体报道,Google母公司Alphabet近日将其最有发展潜力的两个项目:机器人和AI语言处理结合在一起,旨在创造一种能够理解人类自然语言指令的“机器人助手”。
从2019年至今,Alphabet公司研发的机器人已经能够完成如取饮料、擦桌子这类简单的任务。这类“生活助手机器人”的研发仍处于起步阶段,它们动作缓慢,遇事犹豫不决。不过现在,机器人借助Google设计的大规模语言模型PaLM,已经完成了在语言理解方面质的飞跃。
目前,大部分机器人只能听懂像“给我拿瓶水”这样简短的命令。而像GPT-3和Google的MuM这样的大规模语言模型则能够更好地解指令背后的真正含义。例如,测试者现在可以对“生活助手机器人”说,“我把饮料洒了,能帮帮我吗?”。机器人就可以通过内置的动作列表抽取这条指令中的关键信息,并将指令理解为“去厨房把抹布拿来”。
虽然这听上去对“智能”机器人来说不算什么,但这的确是很大的进步。当然,如果有一天当机器人听到你喊叫“该死,饮料又撒了”,然后过来主动帮你。到那个时候,机器人就是真的非常智能了。
Google将上述语言理解系统称作PaLM-SayCan。从名字中可以看出,该系统整合了大模型的语言理解能力(“Say”)和“可执行性语义落地”能力(即机器人可执行的具体动作“Can”)。
Google公司表示,他们近日测试了101条用户指令,其中整合了PaLM-SayCan系统的机器人能够对84%的指令做出有效的行动计划,并正确执行其中74%的指令。虽然数据十分可观,但其真实性仍值得商榷。因为Google没有把这些指令完全公开,所以我们暂不清楚具体的局限性会有哪些。但就现在来看,指望机器人能够完全理解人类语言和指令,还不太现实。
因为在现实生活中,需要执行的指令实在是太多太复杂了。从“帮我打扫一下沙发底下的麦片”到“翻炒一下意大利面酱里的洋葱”,想让机器人理解这些指令,都需要非常多的隐含背景知识。(比如使用什么打扫工具、洋葱存放在冰箱里哪个位置以及怎样切洋葱片等等)这些指令对家用机器人而言,都过于繁杂了。
正因如此,目前在家用机器人领域,唯一销量不错的,也就只有扫地机器人了。因为它唯一的指令就是吸尘。
随着视觉和导航等智能技术的发展,市场上逐渐出现了许多新型机器人。但是这些机器人的能力仍被有意限制。例如Labrador Systems的取物机器人其实就只是一个带轮子的货架,将物品从一个房间搬运到另一个房间。其实这类取物机器人的潜力巨大,未来甚至可以帮助到行动不便的残障人士。不过,想法归想法,人们距离拥有理想中无所不能的机器人还有很长的一段路要走。
Powered by Froala Editor