IT采购网6月26日消息,谷歌旗下的DeepMind公司近日宣布成功研发出一种名为RoboCat的人工智能模型,该模型具备多任务解决和适应的能力,并能够通过不同的真实世界机器人完成任务。这一突破性进展为机器人技术领域带来了新的可能性。
RoboCat的灵感来自DeepMind的另一款AI模型Gato,后者具备文本、图像和事件分析与处理的能力。为了训练RoboCat,研究人员采集了模拟和真实机器人的图像和动作数据,其中包括来自虚拟环境中其他机器人控制模型、人类控制机器人以及RoboCat早期版本的数据。
据IT采购网了解,RoboCat的训练过程包括以下几个步骤:首先,研究人员利用人类控制的机械臂在模拟或真实环境中进行每个任务或机器人的100到1000次演示,例如拾取齿轮或堆叠积木等。随后,他们对RoboCat进行微调,针对每个任务创建专门的"衍生"模型,并进行平均约1万次的训练。通过结合衍生模型生成的数据和演示数据,研究人员不断扩大RoboCat的训练数据集,并训练出新的RoboCat版本。
最终,RoboCat在模拟和真实世界中完成了总共253个任务的训练,并在这些任务的141个变体上进行了测试。DeepMind表示,在观察了1000次人类控制的演示后,RoboCat学会了操作不同类型的机械臂。尽管RoboCat已经在四种具有两爪臂的机器人上进行了训练,但该模型也能够适应一种更复杂的机械臂,该机械臂具备三指夹具和更多的可控输入。
不过,RoboCat在DeepMind的测试中在不同任务上的成功率存在较大差异,最低成功率为13%,最高可达99%。这些结果是基于1000次演示的训练数据得出的,如果演示次数减半,成功率也会相应降低。但在某些情况下,DeepMind声称RoboCat只需观察100次演示即可学习新任务。DeepMind的研究科学家李亚历克斯表示,RoboCat有望进一步降
低学习新任务的难度。他表示,只要提供一定数量的新任务演示,RoboCat就能够进行微调,并自动生成更多数据以进一步提升性能。研究团队的未来目标是减少RoboCat学习新任务所需的演示次数,使之少于10次,以进一步提高效率和适应性。这一研究成果对于推动机器人技术的发展具有重要意义,为机器人在各个领域的应用打开了更广阔的前景。