基于深度学习的表情识别与头部姿态估计算法研究

杨双

南京航空航天大学

下载全文

在线阅读

引用

摘要：

表情识别和头部姿态估计在交通、医疗、教育等领域有着广泛的应用前景，深度学习技术的发展可以大大推动表情识别和头部姿态估计的效果提升。本文基于深度学习开展表情识别和头部姿态估计技术研究，主要研究内容如下：　　对于表情识别：（1）针对VGG19在训练时，由于全连接层参数量过大而易过拟合的问题，本文利用胶囊网络CapsNet的胶囊层对VGG19的全连接层进行替换，实现VGG19与CapsNet相级联，从而改善训练时过拟合这一问题，同时使得级联后的VGG19-CapsNet模型相比于VGG19模型在RAF-DB数据集上的精度提高了4.57%，到达了83.14%的精度。（2）针对级联后的VGG19-CapsNet的特征提取网络的MaxPool易丢失人脸特征图信息的问题，利用SoftPool对MaxPool进行替换，从而在最大程度上保留了人脸的细粒度特征。实验表明，结合SoftPool的模型在RAF-DB数据集上取得了84.21%的精度，在FER2013数据集上取得了73.16%的精度。（3）针对难分表情的存在导致模型识别精度低的问题，本文设计了人脸ROI（感兴趣区域）特征融合分支，加强模型对人脸ROI的学习，改进后的模型在RAF-DB数据集上取得了85.64%的精度，在FER2013数据集上取得了74.56%的精度，具有较好的识别效果。　　对于头部姿态估计：（1）针对复杂背景会对头部姿态估计模型FSA-Net产生干扰、从而降低模型识别精度的问题，本文将坐标注意力机制CoordAttention模块嵌入FSA-Net的特征提取网络中，通过训练帮助模型更精确地定位和识别图像中的关键区域，使得模型对图片中的头部及人脸区域重点关注。（2）针对人脸偏转角度过大，使得人脸特征减少，从而降低模型识别精度的问题，本文在FSA-Net的特征提取网络的基础上利用跨层连接，将网络浅层的特征图信息通过降采样融合进中、深层网络，从而弥补了中深层网络中有用的人脸细节特征的不足，实现特征复用。（3）针对FSA-Net损失函数在零点处由于不可导而导致求解效率低、收敛慢等问题，本文用SmoothL1Loss对原损失函数进行替换，从而改进了模型的收敛情况，提升了模型的识别精度。针对人脸偏转过大而导致模型对于偏航角的测量误差大的问题，本文从损失函数出发，在损失函数中构建一个基于偏航角的权重系数，以提高偏转较大的人脸的损失权重，使得模型重点学习偏转较大的人脸。

关键词：表情识别;头部姿态估计;卷积神经网络;特征融合

授予单位：南京航空航天大学

授予学位：硕士

学科专业：测试计量技术及仪器

导师姓名：王敬东

学位年度：2022

语种：中文

分类号：TP391.41

在线出版日期：2023-11-01（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于深度学习的表情识别与头部姿态估计算法研究