该存储库包含与使用spaCy获取科学文档有关的自定义管道和模型。 特别是,有一个自定义令牌生成器,它在spaCy基于规则的令牌生成器的基础上添加了令牌生成规则,经过生物医学数据训练的POS标记器和语法解析器以及实体跨度检测模型。 另外,还有用于更具体任务的NER模型。 只是想测试数据模型? 查看我们的。 安装 安装Scispacy需要两个步骤:安装库和安装模型。 要安装该库,请运行: pip install scispacy 要安装模型(请参见下面的可用模型的完整选择),请运行以下命令: pip install https://s3-us-west-2.amazonaws.com/a