season1pretrained model预训练模型地址chinese macbert large simcse simcse模型文件data数据信息raw data存放tianchi官网原始数据CPR data存放Multi CPR数据raw dataprocess存放raw data处理后的数据CPR dataprocess存放CPR data处理后的数据season2process为复赛的数据准备0.data4MLM raw.py raw data生成用于MLM的训练集测试集生成文件.dataraw dataprocessMLM.txt.dataraw dataprocessMLM eval.txt分别为MLM的训练集测试集0.convert4MLM CPR.py CPR data生成用于MLM的训练集生成文件.dataCPR data