视频图像序列中自动地进行运动目标的检测、目标跟踪、目标分类和行为理 解等方面的内容,目的是在图像及图像描述之间建立映射关系,从而使计算机能够理解视频画面中的内容