图稀疏组套索的视频到视频标签传播
传统的视频标记方法被设计为在同一级别传播标签,例如将训练视频(或镜头)的标签分配给测试视频(或镜头),例如当训练视频相关联时为测试视频生成标签在视频级使用标签,或在给定带注释镜头的集合时将标签分配给测试镜头。 本文着重于自动镜头标记,其中给出了在视频级别带有标记的视频集合。 换句话说,我们旨在将培训视频中的特定标签分配给测试镜头。 本文通过为测试镜头分配标签(来自一部分培训视频中的部分标签)解决了V2S问题。 为了实现该目标,本文首先提出了一种新颖的Graph Sparse Group Lasso(GSGL的缩写)模型,以训练视频的视觉特征线性重建测试镜头的视觉特征,即找到测试镜头与目标镜头之间的相关性。培训视频。 然后,论文提出了一种新的标记传播规则,以通过学习的相关性将视频级标记分配给测试镜头。 此外,为了有效地构建重建模型,提出的GSGL同时考虑了一些约束条件,例如组间稀疏性,组内稀疏性,训练视频中的时空先验知识以及测试的局部结构射击。 在公共视频数据集上进行了广泛的实验,清楚地证明了所提出的方法处理视频到镜头标签传播的有效性。
暂无评论