视频检索把图像检索、模式识别、图像数据库等技术成果结合了起来,会有广阔的发展前景。  视频检索是从大量的视频数据中找到所需的视频片断及自动统计出所需要的信息。用户提供的例子(模板)或特征描述,系统就能够自动地找到所需的视频片断点,即实现基于内容的视频检索。通常,一段视频可以划分为几个场景,每个场景包含一个或多个镜头,每个镜头又由一系列连续记录的图像帧组成。因此,原始视频可以按照由粗到细的顺序划分为几个层次结构:视频(video)、场景(scene)、镜头(shot)和图像帧(frame)。视频和图像帧是视频本身就具有的结构,而镜头和场景是人为分离出来的结构。镜头一般是由摄像机一次摄像的开始和结束的所有帧构成,表示一个物理概念。而场景是指一连串语义相关的镜