생성모델 介绍 出于纯粹的好奇心,我建立了的数据集,并测试了最近提出的一些深度生成模型。 借助预先训练的人脸生​​成模型和特殊的训练技术,我能够在一个仅使用500张图像的RTX 2080ti GPU上,在大约10小时内以256x256的分辨率训练一个发生器。 资料准备 我使用了的网络漫画图像。 最初的尝试是在漫画图像上使用简单的面部检测器,但是opencv中提供的人脸级联分类器在此卡通域上效果不佳。 也没有,所以我决定手动标记盒子并最终得到500张卡通人脸图像。 由于人脸的大小会因场景而异,因此我使用将小图像放大到256x256分辨率。 GAN + FreezeD 冻结了经过训练的判别器的前几层,并在新数据集上了模型。 我使用了在FFHQ数据集上训练的styleGAN模型,并且在我的环境中花了大约10个小时来微调预训练模型5万步。 有趣的是,在训练的早期阶段,一些最初学习的语义特征被