NLP中文数据增强一键中文数据增强工具 使用: pip install nlpcda 开源不易,欢迎star :glowing_star: pypi: ://pypi.org/project/nlpcda/ 介绍 一键中文数据增强工具,支持: 经过细节特殊处理,比如不改变年月日数字,尽量保证不改变原文语义。即使改变也能被猜出来、能被猜出来、能被踩出来、能被菜粗来、被菜粗、能菜粗来 计划中的未来内容 增加多线程操作,一键操作 随机噪声注入?随机插入一些字符,太简单实现了。 利用pingyin? 基于Word2Vec,BERT等词向量的词组近距离的替换,MASK替换替换??但是无法控制它生