Ta上传的资源 (0)

:针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP- Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语义信息并且改进了知网中DEF词条的描述能力公式,在此基础上对中文短文

本文针对现有特征选择算法没有利用有用的词条频率信息。没有定性分析的现状,提出了基于词条频率的改进特征选择算法,对特征选择算法进行了定性分,提出了构造高效特征选择方法的约束条件和步骤,构造出一种高效的特征选择方法,并用实验证明了改进方法的有效性。