plur:NLP中代表性不足的语言的预训练语言模型 源码
plur:P重新训练ünder-内容r L anguage模型epresented语言 该存储库包含针对NLP中代表性不足的语言的预训练语言模型。 语言模型适用于Flair和ELMo(即将推出:XLNet)。 使用Flair在NER和PoS标记下游任务上评估所有受过训练的语言模型。 巴斯克 语料库 Flair Embeddings和ELMo在最近的Wikipedia转储中接受了培训,并从OPUS和Leipzig Corpora Collection中收集了各种文本。 一些统计: 代币数量:57,110,741(未标记),72,683,662(已标记) 大小:417M(未标记),440M
文件列表
plur-master.zip
(预估有个1文件)
plur-master
README.md
8KB
暂无评论