本文提出了一种基于重复提取的新词检测(NWD)性能评估方法。 对于小型语料库,我们提出采用条件随机场(CRF)作为统计框架来估计不同NWD策略的效果。 对于大型语料库的情况,由于没有注解语料库的无穷大,因此比较实验无法进行评估。 因此,本文提出了一种实用的定量模型,用于分析和评估NWD在各种情况下(尤其是在大型语料库情况下)的性能。 研究表明,实验结果与定量模型的结论之间具有良好的相互验证性。 在对实验数据和定量模型进行分析的基础上,得出了基于两种策略的汉语新WD效果的可靠结论,可以为汉语新词检测的后续研究提供一定的指导。