多项式核函数由于具有良好的泛化性能而受到重视,并被研究用于文本分类问题。针对多项式核学习 能力较差的缺点,将学习能力较强的条件正定核与多项式核构成一个混合核函数作为改进的多项式核。实验表 明,改进的多
一种主题爬虫文本分类器的构建.caj 姜鹏,宋继华 (北京师范大学信息科学与技术学院
从文本分类由美国学者H.P.Luhn教授在1957年第一次被提出来,现今文本分类已经成为数据挖掘领域非常重要的~个分支,它已经在搜索引擎等领域有较好的应用.文本分类中特征选择是降低特征空间维数提高分
文本分类和聚类技术展开了研究,分析了特征抽取法在文本分类和文本聚类中应用的重要性,以及论证了为何要对文本进行特征抽取,最后分别阐述了用于文本分类和文本聚类的特征抽取方法。
基于潜在语义分析和改进的原型算法的跨语言文本分类,赵江,兰曼,随着经济全球化发展,越来越多的组织机构急需自动化归类多语言的文档,然而却受限于缺少已知类别的外文文档。跨语言的文本分类技
数字化的建筑信息大量存在和应用于建筑设计、城市规划等领域。目前,由于建筑信息模型的数据量急剧膨胀,为克服“数据丰富而知识匮乏”现象,对其进行基于内容的模型分类十分必要。提出一种结合空间句法理论和基于S
利用商标图像的形状特征,提出了一种融合图像全局特征和局部特征的商标检索算法。其中全局特征反映了图像的整体信息,这些信息可用来较快地建立候选图像库,而局部特征则可以更准确地与候选图像进行匹配。提取图像的
关于文本分类的一篇不错的硕士论文,详细的讨论介绍了文本分类中的特征选择技术。。。
文本的表示及其特征项的选取是信息检索的一个基本问 题, 它把从文本中抽取出的特征词进行量化来表示文本信息。
文本分类新论文很值得看尤其是数据挖掘方面的相关学习者