DOI：10.3969/j.issn.1672-1470.2021.03.008

基于VGG16和BiLSTM的视频摘要生成

引用

摘要：

当前,城市生活节奏越来越快,信息化建设飞速发展,信息量与日俱增.面对庞大的视频信息,用户更想快速了解视频主题、视频精华在哪里,以及如何快速提取.适应这一需求的发展,视频摘要技术由此诞生.传统的视频摘要方法往往只考虑图像特征,忽略了视频本身还具有时序特征.此外,传统方法多为静态摘要,生成的摘要视频不具有连贯性.针对上述问题,本文提出了一种基于VGG16和BiLSTM的动态视频摘要方法.该方法首先对视频进行镜头划分,然后用VGG16提取视频帧的深度特征,再将深度特征输入到BiLSTM中预测视频帧级分数,最后根据帧级分数计算出镜头分数并选出关键镜头,将关键镜头组合成视频摘要.实验在TvSum和SumMe两个数据集上进行,实验结果表明该方法取得了不错的效果,能够生成具有代表性的视频摘要.

关键词：视频摘要;动态摘要;VGG16;长短期记忆网络

在线出版日期：2021-09-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：38-42

个人中心

我的学术圈

我的书案

退出

期刊专题

基于VGG16和BiLSTM的视频摘要生成