10.3969/j.issn.1672-1470.2021.03.008
基于VGG16和BiLSTM的视频摘要生成
当前,城市生活节奏越来越快,信息化建设飞速发展,信息量与日俱增.面对庞大的视频信息,用户更想快速了解视频主题、视频精华在哪里,以及如何快速提取.适应这一需求的发展,视频摘要技术由此诞生.传统的视频摘要方法往往只考虑图像特征,忽略了视频本身还具有时序特征.此外,传统方法多为静态摘要,生成的摘要视频不具有连贯性.针对上述问题,本文提出了一种基于VGG16和BiLSTM的动态视频摘要方法.该方法首先对视频进行镜头划分,然后用VGG16提取视频帧的深度特征,再将深度特征输入到BiLSTM中预测视频帧级分数,最后根据帧级分数计算出镜头分数并选出关键镜头,将关键镜头组合成视频摘要.实验在TvSum和SumMe两个数据集上进行,实验结果表明该方法取得了不错的效果,能够生成具有代表性的视频摘要.
视频摘要;动态摘要;VGG16;长短期记忆网络
2021-09-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
38-42