NLP-语义相似度分析-常用数据集——SICK数据集,共10000个样本。 SICK数据集的格式比较规整,有以下几个特点:1.无错别字2.无乱码干扰词3.主谓宾完整