CorefBERT:EMNLP 2020论文“用于语言表示的同等推理学习”的源代码 Source code learning
CorefBERT “”的源代码和数据集。 该代码基于huggaface的。 多亏了他们! 可以从/下载预训练的模型。 要求 安装依赖项和: pip3 install -r requirement.txt python3 -m spacy download en_core_web_sm 预训练 代码位于文件夹“ Pretrain /”中。 下载。 使用并从Wikipedia数据库转储中清除文本。 python3 WikiExtractor.py wikipedia/enwiki-20190820-pages-articles-multistream.xml.bz2 --json --output wikipedia/ --bytes 500M --processes 8 从Wikipedia中提取名词: python3 gen_copy_data_NN.py --train
文件列表
CorefBERT:EMNLP 2020论文“用于语言表示的同等推理学习”的源代码-Source code learning
(预估有个228文件)
LICENSE
1KB
WikiExtractor.py
116KB
README.md
8KB
tokenization_utils.py
54KB
modeling_xlnet.py
72KB
modeling_xlm.py
46KB
test_sentencepiece.model
247KB
modeling_roberta.py
49KB
modeling_bert.py
77KB
modeling_tf_xlnet.py
56KB
暂无评论