语义相似性数据集,数据量:训练集 (238,766),验证集 (8,802),测试集 (12,500)