jatecs:Java文本分类系统 源码
JaTeCS(Java文本分类系统) JaTeCS是专注于自动文本分类(ATC)的开源Java库。 它涵盖了实验活动的所有步骤,从阅读语料库到评估实验结果。 JaTeCS专注于将文本作为中心输入,并且其代码针对此类数据进行了优化。 与许多其他机器学习(ML)框架一样,它为多种格式和知名语料库,NLP工具,功能选择和加权方法,多种ML算法的实现以及知名外部软件的包装器(例如libSVM,SVM_light)。 JaTeCS还提供了与ATC相关的方法的实现,而其他ML框架很少(如果没有的话)(例如,主动学习,量化,转移学习)提供与ATC相关的方法。 该软件根据条款。 软件安装 要在您的Maven项目中使用JaTeCS的最新版本,请在项目POM中添加以下内容: jatecs-mvn-repo