LCQMC_data.7z
语义相似度任务数据训练集、验证集、测试集。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,用于判断两个问题的语义是否相同。 输入是两个句子,输出是 0 或 1。其中 0 代表语义不相似,1 代表语义相似。 数据量:训练集 (238,766),验证集 (8,802),测试集 (12,500) 例子: 1. 聊天室都有哪些好的 [分隔符] 聊天室哪个好 [分隔符] 1 2. 飞行员没钱买房怎么办?[分隔符] 父母没钱买房子 [分隔符] 0
文件列表
LCQMC_data.7z
(预估有个4文件)
LCQMC_dev.csv
683KB
vocab.txt
31KB
LCQMC_test.csv
771KB
LCQMC_train.csv
15.97MB
暂无评论