阿拉伯语 方言分类 纳迪共享任务 源码
NADI 2020年阿拉伯语方言分类共享任务 阿拉伯语有各种各样的方言。 由于资源稀少,许多这些方言仍然未被充分研究。 共同任务的目标是减轻细粒度阿拉伯语方言识别的瓶颈。 识别方言是根据推文本身对推文作者的方言进行分类的任务。 我们在此仓库中展示了我们的模型,该模型在WANLP 2020排名第四 通过运行train.py文件,您可以开始训练过程。 config_train.txt中有可以更改的多重参数,稍后将提供详细说明。 信用 拥抱脸 farasa seg rwdepo
文件列表
Arabic-Dialect-Classification-Nadi-Shared-Task-main.zip
(预估有个12文件)
Arabic-Dialect-Classification-Nadi-Shared-Task-main
requirements.txt
26B
run_model.py
3KB
FarasaSegmenterJar.jar
7.31MB
models.py
3KB
utils
tokenizer.py
1KB
reader.py
2KB
preprocess_arabert.py
5KB
helper_func.py
2KB
暂无评论