FaceScrub数据集是一个包含超过100,000张图像的大型面部数据集,涵盖了530位不同名人的面部。这一数据集在推动人脸识别研究方面具有重要的作用。构建如此庞大的数据集通常是一项繁琐的任务,因为需要对大量原始数据进行清理和整理。为了简化这一过程,我们采用了一种新的方法,通过检测互联网上搜索公共人物后返回的图像中的面部来创建FaceScrub数据集。然后,我们使用自动化系统排除了不属于每个被查询者的面部。FaceScrub数据集经过这一筛选和清理过程,总共包含106,863张男女530位名人的面部图像,每人约200张。因此,它是目前最大的公开数据库之一。这些图像来自互联网,是在实际情况下拍摄的,并且包括了面部的名称和性别注释。