敏感词屏蔽工具基于DFA算法的实现

DFA算法

realization5881 19 0 zip 2023-11-11 11:11:25

本文探讨了一种基于DFA算法的敏感词屏蔽工具的实现。该工具在字符串处理上具有高效的性能，用户只需提供待处理的字符串，即可获得屏蔽敏感词后的结果。特别值得注意的是，工具能够智能地忽略掉无效字符，包括汉字、字母、数字以外的符号。

功能方面，敏感词屏蔽工具提供了灵活的敏感词库管理功能。用户可以根据实际需求重新选择敏感词库，同时还能通过添加单个敏感词来进行个性化定制。这使得工具更加适用于不同场景和用户需求。

为了进一步满足用户的需求，该工具还具备查询字符串是否存在敏感词的功能，而无需进行屏蔽。这为用户提供了更多操作选择的空间，使工具更加灵活实用。

文件结构方面，工具提供了源码（dfa.py）、性能测试（TestDFA.py）、默认敏感词库（sensitive_words.txt）等文件。另外，DfaApi.py实现了一个运行于web上的API接口，支持text_filter/string命令返回是否存在敏感词以及屏蔽后的字符串，add_new_words/string命令用于向敏感词库添加新的敏感词，change_text/string命令用于修改新的敏感词库，其中string为新文件的路径。

文件列表

sensitive_words_blocking-master.zip (预估有个7文件)

sensitive_words_blocking-master

_config.yml 26B

DfaApi.py 1KB

sensitive_words.txt 27KB

example.py 464B

dfa.py 4KB

TestDFA.py 2KB

README.md 829B

用户评论

暂无评论

简易敏感词过滤

简易的敏感词过滤。

30 2020-01-13
34000多条敏感词

通过各种渠道收集的敏感词，涉黄、涉爆、涉政；可用于构建敏感词库、自然语言处理污词发现的对比语料；详细不重复。

68 2019-01-01
JAVA过滤敏感词

自己过滤工程博文链接:https://uule.iteye.com/blog/2262385

23 2020-08-16
Java实现DFA执行模拟算法3.1

算法3.1 模拟一个DFA的执行，利用Java语言实现。可根据输入的字符串进行判断，判断其是否能被该DFA识别。该算法的实现方法和具体步骤均详细解释。同时给出了相关的Java代码。

55 2018-12-07
Python实现敏感词检索与描红输出

Python诞生于1989年，首个发布版本问世于1991年，被定义为一种解释型、面向对象、具有动态语义的高级编程语言。它以简洁、强大而闻名，注重解决问题的方法，而非语法繁琐。广泛应用于通用程序、自动化

1 2024-04-19
屏蔽了输入参数敏感性的DBSCAN改进算法.pdf

提出了一种新的DBscAN改进算法，通过记录簇连接信息，能够有效地屏蔽输人参数敏感性，提高聚类结果的质量，同时保持了DBscAN算法的高执行效率。测试结果表明新算法的性能较高。

33 2019-04-10
基于dfa的敏感词过滤的小商城系统我自己开发的莫得版权问题哇为啥不通过

本科毕业设计基于dfa的敏感词过滤的小商城系统,并且使用了部分协同过滤中的推荐物品的算法,java自行实现了一部分。可联系QQ邮箱:1115479227@qq.com 请注明查看来源以及目的。

16 2020-08-06
基于Python实现敏感词检索并描红输出及项目源码

1.Python起源与定义Python是由荷兰程序员吉多·范罗苏姆于1989年发布的，第一个公开版本于1991年问世。Python被定义为一种解释型、面向对象、具有动态语义的高级编程语言。通俗来说，P

9 2024-04-19
JAVA敏感词过滤的代码

算法思路:把敏感词的第一个字符取出来,作为比较对象。遍历整个字符串,如果发现字符跟敏感词第一个字符相同,就从字符串取出跟关键词相同长度的子串比较,如果相同就替换。本算法比较适合敏感词都不长的场合。

22 2020-09-27
敏感词过滤的设计java

java 敏感词过滤的设计思路和技术问题

16 2020-08-22

敏感词屏蔽工具基于DFA算法的实现

文件列表

用户评论

推荐下载