基于视觉的人体行为识别技术研究

吕温

南京航空航天大学

下载全文

在线阅读

引用

摘要：

人体行为识别是机器视觉的重要研究方向之一，其在智能监控、人机交互等方面有着广阔的应用前景，同时由于人体行为的复杂性，目前对其研究尚处于起步阶段。本文对单人人体行为识别技术进行了研究。　　首先，根据人类对行为描述的直观思维，研究了基于整体特征的人体行为识别算法。为了提取出人体目标，对比研究了主流的运动目标检测算法。由于人体目标可能存在平移、缩放、旋转等几何失真，本文采用仿射不变矩提取行为特征，并使用基于DTW的模板匹配算法实现行为识别。在KTH行为数据库上的验证实验结果表明，基于整体特征的人体行为识别算法取得了47.22％的识别率。　　然后，针对人体目标分割不准确导致基于整体特征的行为识别算法效果不佳的问题，研究了基于时空兴趣点的人体行为描述方法，该方法无需精确的人体定位与分割。针对视频序列提取的时空兴趣点数个数不一而导致无法直接分类的问题，本文采用词袋模型的思想，将视频序列表示为词袋中视觉关键词的统计直方图，使得各个视频序列可以用相同维数的特征向量来描述。由于时空兴趣点位置信息包含的行为特征较少，本文研究了基于局部特征的时空兴趣点描述算法。针对局部亮度特征对人体衣着和背景光照变化比较敏感的问题，本文研究了基于局部梯度方向直方图特征与局部Haar特征的时空兴趣点描述方法，并利用主成分分析降低其维数，减小计算复杂度。在KTH行为数据库上的验证实验表明，采用局部梯度方向直方图特征的行为识别率为87.36%，采用局部Haar特征的行为识别率为86.39%，分别比局部亮度特征提高了36.52%和35.55%，分别比时空兴趣点位置特征提高了46.80%和45.83%，分别比整体仿射不变矩特征提高了40.14%和39.17%。　　最后，针对基于词袋模型的人体行为识别算法实时性不高的问题，本文在研究时空兴趣点分布规律的基础上，提出利用时空兴趣点的分布特征描述人体行为，并利用连续隐马尔科夫模型对人体行为建模与分类。在 KTH 行为数据库的验证实验结果表明，实时性比词袋模型提高了42.26%。

关键词：人体行为识别;运动目标检测;视频序列;统计直方图;不变矩提取

授予单位：南京航空航天大学

授予学位：硕士

学科专业：测试计量技术及仪器

导师姓名：徐贵力

学位年度：2014

语种：中文

分类号：TP391.41;TP301.6

页数：80

在线出版日期：2016-03-01（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于视觉的人体行为识别技术研究