工业机器人可以有极好的精确度和速度,但是它们通常需要人非常谨慎的编写程序,从而做一些像抓取物品这样的事。这是很困难且耗费时间的,意味着这样的机器人往往只能在高度控制的环境中工作。
机器人研究员正在测试强化学习,将它作为一种简化和加快工厂机器人编写程序的手段。这个月早期,Google发布了自己研究使用强化学习教机器人如何抓紧物品的细节信息。
Fanuc机器人是由Preferred Networks编写程序。Fanuc这家世界最大的工业机器人生产商,去年八月对PreferredNetworks投资了730万美元。这家两家公司去年12月在东京的国际机器人展览会上展示了这个学习型机器人。
Hido说,这种学习方式潜在的一个巨大好处是,如果几个机器人并行工作然后分享他们学到的,就可以促进学习。所以,八个机器人一起工作一小时可以执行与一台机器工作八小时时相同的学习任务。「我们的计划是面向分散式学习的,」Hido说,「你可以想象成百上千个机器人分享信息。」
这种分散式学习的形式,有时叫做「云机器人」,正在成为科研界和产业界的大趋势。