eda_nlp:NLP的数据增强在EMNLP 2019上展示 源码
EDA:轻松的数据增强技术可提高文本分类任务的性能 这是EMNLP-IJCNLP论文 解释EDA的博客文章在 。 更新:在中文找到EDA的外部实现。 和邹凯。 注意:请勿向我发送问题的电子邮件,因为我不会回复。 而是打开一个问题。 我们目前EDA:电子ASY d ATA一个ugmentation技术提高文本分类任务中的表现。 这些是一组易于实施的通用数据增强技术,并显示出对五个NLP分类任务的改进,对大小为N < 500数据集也进行了重大改进。 虽然其他技术要求您在外部数据集上训练语言模型只是为了获得一点点提升,但我们发现使用EDA进行简单的文本编辑操作会带来良好的性能提升。
文件列表
eda_nlp-master.zip
(预估有个50文件)
eda_nlp-master
.gitignore
188B
preprocess
shuffle_lines.py
203B
trej_clean.py
675B
get_stats.py
757B
create_dataset_increments.py
220B
copy_sized_datasets.py
463B
cr_clean.py
1KB
bg_clean.py
16KB
暂无评论