发明人:邓涛; 张晟东; 张立华; 李志建; 古家威
本发明涉及机器人控制技术领域,具体公开了一种机器人步态自主学习方法、装置、电子设备及存储介质,其中,方法包括以下步骤:获取待模仿生物的动作捕捉信息;获取待模仿生物所在的场景状态信息;根据场景状态信息构建决策网络;根据决策网络和动作捕捉信息构建对抗判别器;固定决策网络,对抗训练对抗判别器,以最优化地区分动作捕捉信息和决策网络的输出结果;根据训练后的对抗判别器训练决策网络,以生成用于控制机器人步态的动作决策模型;该方法获取的动作决策模型能直接根据场景状态信息生成与动作捕捉信息接近的动作决策,不再需依赖马尔科夫链以及隐式变量推断,大大简化了模型的训练与部署流程,有效提高模型的训练效率。
点评推荐
添加表情
发言
累计参与人数(0)
权利声明:
本站商品及服务信息均来自于合作方,其真实性、准确性和合法性由信息拥有者(合作方)负责。本站不提供任何保证,并不承担任何法律责任。
价格说明:
标价:商品展示的价格为参考价,并非最终交易价,该价格可能是实物商品的品牌专柜标价、商品吊牌价或由品牌供应商提供的正品零售价(如厂商指导价、建议零售价等)或该商品曾经展示过的销售价;亦可能是服务等非实物商品的初始洽谈价格,该价格仅供您参考;平台提供议价功能,最终交易价格以订单最终确认价格为准。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。