argumentsation_mining_pt 源码
葡萄牙语的论证挖掘 该存储库包含葡萄牙语的端到端序列标记任务。 它使用来自以下第三方存储库的代码: 来自预处理数据; 注释投影算法; 作为单词对齐工具; 作为神经标记者; 多语言单词嵌入。 用法 就使用脚本文件的的基础上注释投影语料库或脚本的顺序标注模型火车和评价。 有关如何使用标记工具来训练/评估/保存模型的详细说明,请参阅。 建立葡萄牙语数据集 假定以下文件结构:DATASET_ROOT_DIR├──en_pe#有说服力的论文ConLL格式| └──train.dat │└──dev.dat│└──test.dat 自由文本 首先,为每个train / dev / test文件创建自由文本文件。 python src/convert_to_free_text.py data/auxiliary/train_ft.txt data/en_pe/train.dat python
文件列表
argumentation_mining_pt-main.zip
(预估有个79文件)
argumentation_mining_pt-main
.gitignore
2KB
src
text_file_stats.py
761B
align.py
1KB
utils.py
505B
project_annotations.py
8KB
simalign
__init__.py
55B
utils.py
600B
暂无评论