gector:“ GECToR –语法错误校正”论文的正式实施 源码
GECToR –语法错误纠正:标记,不重写 该存储库提供以下代码的正式PyTorch实施,用于训练和测试语法错误纠正的最新模型的代码: , , , 文法 它主要基于AllenNLP和transformers 。 安装 以下命令将安装所有必需的软件包: pip install -r requirements.txt 该项目已使用Python 3.7进行了测试。 数据集 本文中使用的所有公共GEC数据集都可以从下载。综合创建的数据集可在生成/下载。要训练模型数据,必须对其进行预处理,并使用以下命令将其转换为特殊格式: python utils/preprocess_data.py -s SOURCE -t TARGET -o OUTPUT_FILE 预训练模型 预编码器 置信偏差 最小错误概率 CoNNL-2014(测试) BEA-2019(测试) BERT 0.10
文件列表
gector-master.zip
(预估有个20文件)
gector-master
.gitignore
2KB
predict.py
5KB
README.md
5KB
utils
prepare_clc_fce_data.py
4KB
preprocess_data.py
18KB
helpers.py
7KB
docs
training_parameters.md
3KB
暂无评论