相似文本标定是抄袭检测的一个重要环节,现有标定方法大多采用直接对文本或指纹进行合井的方式,标定精度受干扰信息影响较大。针对这种局限性,分析了匹配指纹对的语义特征,提出基于斜率密度的相似文本聚类方法,将文本匹配合井问题转化成稠密样本点聚类问题,井在 PAN 公用语料库上对该方法进行了测试,得到的主要指标优于 PAN10 前 3 名。目前已将该方法用于华南理工大学特色专业教学平台的作业查抄,取得了较好的效果。