spaCy + Stanza(以前称为StanfordNLP) 该软件包包装了 (以前称为StanfordNLP)库,因此您可以将Stanford的模型用作管道。 斯坦福(Stanford)模型在CoNLL 2017和2018共享任务中实现了最高的准确性,该任务涉及58种语言的标记化,词性标记,形态分析,词形化和标记依赖项解析。 从v1.0开始,Stanza还支持选定语言的命名实体识别。 :warning: 该软件包的先前版本可以通过 。 使用此包装器,您将能够使用由预训练的stanza模型计算出的以下注释: 统计标记化(反映在Doc及其标记中) token.lemma ( tok