一种视频时空特征提取算法及其应用研究

引用

摘要：

目前基于内容特征的视频检索系统,大多采用提取视频关键帧的颜色、纹理、形状等底层特征,来进行视频相识度匹配,这些底层特征是基于全局统计或者人工设计的特征提取方式,存在泛化抽象能力不强、易受光照和噪声的影响等问题,同时,由于未考虑视频帧时序上的关联性,导致视频检索精度偏低.为此,基于深度学习框架,提出了一种视频时空特征提取算法.该算法以关键帧附近16帧图像作为学习源,采用三维卷积神经网络,融合帧的内容特性和时序变化特性,获取4096维特征向量作为新的视视时空特征描述子.在标准动作视频数据集UCF-101上进行实验,结果表明该特征能显著提高视频检索精度,在查全率为90％的情况下,平均查准率不低于84％,检索效果优于传统视频检索方法.

关键词：视频检索、三维卷积神经网络、时空特征、深度学习

所属期刊栏目：38

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目;广东省自然科学基金资助项目;广东省工程技术研究中心项目;佛山市工程技术研究中心项目

在线出版日期：2020-08-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：16-23

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

一种视频时空特征提取算法及其应用研究