EDA:轻松的数据增强技术可提高文本分类任务的性能 这是EMNLP-IJCNLP论文 解释EDA的博客文章在 。 更新:在中文找到EDA的外部实现。 和邹凯。 注意:请勿向我发送问题的电子邮件,因为我不会回复。 而是打开一个问题。 我们目前EDA:电子ASY d ATA一个ugmentation技术提高文本分类任务中的表现。 这些是一组易于实施的通用数据增强技术,并显示出对五个NLP分类任务的改进,对大小为N < 500数据集也进行了重大改进。 虽然其他技术要求您在外部数据集上训练语言模型只是为了获得一点点提升,但我们发现使用EDA进行简单的文本编辑操作会带来良好的性能提升。