Ta上传的资源 (0)

这是本人编写的用java进行海量文本特征提取,提取出来的格式是weka数据挖掘工具能够识别的,可以用weka来进行文本的分类和聚类等一些数据挖掘方法。压缩包里面已经有了训练集和测试集这两种文档,大家可以用editplus软件打开,此程序可以针对海量文本进行分类和聚类,但必须用到weka数据挖掘工具。

这个是平时用java编写的能够用weka数据挖掘软件直接进行文本分类的源代码,对文本的特征提取有比较好的效果,其中有两个文件已经做好了,是文本的训练集合测试集,用netbeasns\eclispe都好使,直接用这两个软件其中任意一个打开即可。如果不懂得请加QQ:10642346