10.3969/j.issn.0372-2112.2019.08.006
基于多视觉描述子及音频特征的动态序列人脸表情识别
关于面部表情识别的应用也正在渗透至各个领域,如安全驾驶、商品销售、临床医学等等.本文对面部表情识别相关技术进行研究,主要工作及贡献如下:研究非约束条件下人脸动态表情识别,提出了一种基于多视觉描述子及音频特征融合策略的动态表情识别算法.借助多视觉描述子的空时局部特征描述实现动态表情特征的提取;而视频、音频特征的融合策略改善了表情识别性能.基于协方差矩阵及时间轴分段的动态规整,有效地解决了具有不同时长的动态表情序列的样本描述.为进一步改善表情识别模型的泛化性能,本文引入了基于多个体识别模型加权投票的集成识别模型.针对投票过程中的权值学习,提出了基于随机重采样的投票权重学习以及基于个体分类模型相对优势的投票权重学习方法.集成决策进一步改善了表情识别性能.基于AFEW5.0的动态表情库实验验证了算法的有效性.
动态表情识别、多视觉描述子、集成分类器、权重学习
47
国家自然科学基金U1832217;面向智能驾驶的新能源汽车电子开放平台建设与产业化KFJ-STS-ZDTP-045
2019-09-09(万方平台首次上网日期,不代表论文的发表时间)
共11页
1643-1653