基于双层视觉密码本的有效图像表示
最近,基于视觉词袋(BoW)的图像表示在图像分类和检索应用中引起了很多关注。 众所周知,视觉密码本的构造和相关的量化方法在BoW模型中起着重要的作用。 传统上,视觉代码簿是通过将局部特征聚类成组而生成的,原始特征很难量化到其最近的中心。 众所周知,量化误差可能会降低BoW表示的有效性。 为了解决这个问题,文献中已经提出了几种基于软量化的方法。 但是,这些方法的有效性仍然不能令人满意。 在本文中,我们提出了一种基于双层码本的新颖有效的图像表示方法。 在这种方法中,我们首先构造双层码本以显着减少量化误差。 然后,受局限性线性编码方法的启发[18],我们提出了一种基于岭回归的量化方法,将多个视觉词分配给局部特征。 此外,集成了k最近邻策略以提高量化效率。 为了评估建议的图像表示,我们将其与图像分类实验中两个基准数据集上的现有图像表示进行比较。 实验结果证明了其优于最新技术的优越性。
暂无评论