该文提出一种基于异构哈希网络的跨模态人脸检索方法。异构哈希网络能够将位于不同空间的人脸图像和人脸视频映射到一个公共且有判别力的二值空间上,以获得有效的二值哈希表示。该网络包含图像分支视频分支哈希函数三个部分,首先图像和视频分支分别将人脸图像和人脸视频映射到一个公共空间,然后在公共空间学习非线性哈希函数。网络的训练使用了三种损失函数:Fisher损失softmax损失三元排序损失(triplet rank loss),其中的Fisher损失关注于公共空间的判别力,softmax损失强调公共空间上表达的可分性,三元排序损失提升最终的检索性能。多个人脸视频数据集上的跨模态人检索实验结果表明了所提出方法的有效性。