GECToR –语法错误纠正:标记,不重写 该存储库提供以下代码的正式PyTorch实施,用于训练和测试语法错误纠正的最新模型的代码: , , , 文法 它主要基于AllenNLP和transformers 。 安装 以下命令将安装所有必需的软件包: pip install -r requirements.txt 该项目已使用Python 3.7进行了测试。 数据集 本文中使用的所有公共GEC数据集都可以从下载。综合创建的数据集可在生成/下载。要训​​练模型数据,必须对其进行预处理,并使用以下命令将其转换为特殊格式: python utils/preprocess_data.py -s SOURCE -t TARGET -o OUTPUT_FILE 预训练模型 预编码器 置信偏差 最小错误概率 CoNNL-2014(测试) BEA-2019(测试) BERT 0.10