厄尼 “ ”的源代码和数据集 要求: 火炬> = 0.4.1 Python3 tqdm boto3 要求 顶点(如果要使用fp16,则应确保提交为79ad5a88e91434312b43b4a89d66226be5f2cc98 。) 准备训练前数据 运行以下命令以创建训练实例。 # Download Wikidump wget https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2 # Download alise wget -c https://cloud.tsinghua.edu.cn/f/a519318708df4dc8a853/ ? dl=1 -O alias_entity.txt # WikiExtractor python3 pretrain_