NLPre:用于自然语言预处理的Python库(NLPre) 源码
自然语言预处理(NLPre) 主要版本更新! NLPre 2.0.0 后端NLP引擎pattern.en已被spaCy v 2.1.0取代。 这是针对pattern.en某些问题(包括不良lemmatization)的主要解决方案。 (例如,细胞因子->细胞牛) 对python 2的支持已被删除 在replace_from_dictionary支持自定义词典 在replace_from_dictionary使用后缀而不是前缀的选项 URL替换现在可以删除电子邮件 token_replacement可以删除符号 NLPre是一个文本(预处理)库,可帮助消除实际数据中发现的某些不一致之处。 纠
文件列表
NLPre-master.zip
(预估有个68文件)
NLPre-master
MANIFEST.in
318B
.travis.yml
205B
fabfile.py
550B
tests
doc1_right
1KB
url_replacement_tests.py
2KB
titlecaps_tests.py
2KB
doc2
2KB
dedash_tests.py
2KB
暂无评论