这个是LDA的源代码,里面实现了中文分词,以及有实际的数据,我都已经写好了,可以把数据以文件夹的形式读入,方便使用