发明人:李祯其; 胡尧; 温志庆
本发明涉及语音识别技术领域,具体公开了一种用于语音识别的多模态数据融合方法、装置、设备及介质,其中,方法包括步骤:利用多门控混合专家网络根据多模态数据获取不同模态数据的嵌入表示;根据多门控混合专家网络的专家网络及门控网络结合嵌入表示获取不同模态数据在不同门控阶段的融合权值;在每个门控阶段根据融合权值加权融合对应门控阶段输入的多模态数据生成初步融合数据,并将初步融合数据拼接单模态数据作为下一门控阶段输入的多模态数据;该方法根据多门控混合专家网络获取多模态数据不同模态在不同门控阶段中的融合权值,并根据融合权值对多模态数据进行多阶段融合,能有效提高语音识别的鲁棒性、准确率。
点评推荐
添加表情
发言
累计参与人数(0)
权利声明:
本站商品及服务信息均来自于合作方,其真实性、准确性和合法性由信息拥有者(合作方)负责。本站不提供任何保证,并不承担任何法律责任。
价格说明:
标价:商品展示的价格为参考价,并非最终交易价,该价格可能是实物商品的品牌专柜标价、商品吊牌价或由品牌供应商提供的正品零售价(如厂商指导价、建议零售价等)或该商品曾经展示过的销售价;亦可能是服务等非实物商品的初始洽谈价格,该价格仅供您参考;平台提供议价功能,最终交易价格以订单最终确认价格为准。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。
注:如您发现商品售价或促销信息有异常,建议购买前先联系卖方咨询。