亵渎检查:快速强大的Python库用于检查字符串中的冒犯性语言 源码
亵渎检查 一个快速,强大的Python库,用于检查字符串中的亵渎或攻击性语言。 在 了解有关如何以及为什么建立profanity-check更多 。 您也可以测试profanity-check 。 这个怎么运作 profanity-check使用线性SVM模型,该模型在200k个人标记的纯净亵渎文本字符串样本上训练。 它的模型很简单,但是却出奇的有效,这意味着profanity-check既健壮又性能极佳。 为什么要使用亵渎性检查? 没有明确的黑名单 许多亵渎检测库使用硬编码的坏词列表来检测和过滤亵渎行为。 例如,使用,甚至仍使用。 这种方法显然存在明显的问题,尽管它们可能是高性能的,但这些
文件列表
profanity-check-master.zip
(预估有个13文件)
profanity-check-master
.gitignore
1KB
README.md
5KB
tests
test_profanity_check.py
749B
__init__.py
0B
LICENSE
1KB
profanity_check
profanity_check.py
498B
__init__.py
71B
暂无评论