EEA语料库(Alpha阶段) 该docker图像基于spaCy,Textacy,pyLDAvis和其他文件,以分析EEA语料库(所有已发布的EEA文档的集合)或带有文本列的任何其他CSV文件。 它提供了许多可以在EEA语料库或其一部分上运行的机器学习和自然语言处理算法。 想法是在可能的情况下通过REST API提供这些方法。 当前功能 编写文本转换管道以准备语料库 首先上传CSV文件,然后使用“创建语料库”按钮进入管道组成页面。 通过pyLDAvis创建和可视化主题模型。 通过称为的文本挖掘技术可以找到。 在机器学习和自然语言处理中,主题模型是一种统计模型,用于发现文档集合中出现的