发明人:张宏; 叶汉京; 何力; 管贻生; 黄兴鸿; 陈广诚
本发明公开了一种基于深度学习的动作识别方法,包括如下步骤:对视频帧F进行提取,划分为T*16帧;对每16帧fi进行光流提取得到相应光流图;利用多尺度的3D卷积神经网络分别对连续的16帧RGB图和光流图进行特征提取,分别得到两个特征向量xoriginal和xoptical;将获得的两个特征向量串联在一起得到特征向量xi,维度为d1;重复上述步骤并行处理T次,最终得到一个维度为(d1,T)的特征矩阵X;通过一个以注意力机制为核心构建的一个网络,得到权值矩阵A;将权值矩阵A代入公式M=A*XT获得新的特征矩阵M;将新的特征矩阵M输入至LSTM网络,再经过全连接层的降维,得到特征向量Xfinal;最后利用softmax进行分类,取最大值对应的类别为所识别的动作类别。
点评推荐
累计参与人数(0)
权利声明:
本站商品及服务信息均来自于合作方,其真实性、准确性和合法性由信息拥有者(合作方)负责。本站不提供任何保证,并不承担任何法律责任。
价格说明:
标价:商品展示的价格为参考价,并非最终交易价,该价格可能是实物商品的品牌专柜标价、商品吊牌价或由品牌供应商提供的正品零售价(如厂商指导价、建议零售价等)或该商品曾经展示过的销售价;亦可能是服务等非实物商品的初始洽谈价格,该价格仅供您参考;平台提供议价功能,最终交易价格以订单最终确认价格为准。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。