文章摘要:针对现有人机交互中的手势识别算法不能有效消除采集背景对待提取手势区域存在的影响以及难以对手势的运动信息进行准确建模的问题,提出了利用深度可分离残差卷积长短期记忆(LSTM)网络的方法对动态手势的特征信息进行建模和识别。首先,利用常规3D卷积操作对输入的视频帧进行特征的初步提取,通过较大的卷积核尺寸以扩大其感受野;然后,通过可分离卷积残差操作对输入的浅层特征进行特征的再提取,实现对高维特征的提取建模;最后,将经过前两个阶段提取出的特征信息经过3D池化操作后输入到LSTM网络中,对输入的视频数据的时序信息进行建模,并在输入中引入注意力机制。在大规模孤立手势数据集上进行的相关实验结果表明,所提方法的准确率与原始的MFSK+BoVW+SVM网络相比提高了21.02个百分点。
文章关键词:
论文分类号:TP391.41;TP183
文章来源:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2022/0108/2443.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话:13080520030(微信同号) 投稿邮箱:kf@400qikan.com