从视频或图像中检索,识别出目标对象并进行跟踪。