器学习文本分类 测试集,用于机器学习算法的测试。复旦大学
基于Bolo的分析 在WinXP + IIS 6.0 的操作平台下,设计开发了网上《教学互动系统》。主要介绍了这套系统的设计结构和功能,叙述了系统的开发、应用环境和功能模块介绍。
,提出了互依赖和等效半径的概念,并将两者相结合,提出新的分类算法———基于互依赖和等效半径、易更新的分类算法"U*,!XUK"U*,!XU计算复杂度较低,而且扩展性能较好,适用于大规模场合K将"U
该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0. ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):
传 统 的 KNN 文 本 分 类 算 法 是 一 种 无 监 督 的 、 无 参 数 的 、 简 单 的 、 较 流 行 的 且 容 易 实 现 的 分 类 算 法 。 但 是 KNN 算 法 在
本文主要针对中文网页,分析比较了文本分类中的关于类别阈值的几种策略,分别是: 位置截尾法(RCut)、比例截尾法(PCut)、最优截尾法(SCut)以及改进型截尾法(RTCut),主要实验结果有: R
介绍文本分类中特征提取方法的比较与分析,信息增益、卡方等方法
自己设计的小项目,初始想法很简单,检验自己爬虫和nlp基本技能(分词、词向量(tokenize\onehot\tfidf\word2vec))和各类算法(朴素贝叶斯、svm、CNN、LSTM)掌握情况
论述了4种不同的文本压缩算法。根据压缩算法的优点和缺点, 在实践中, 要有针对性选择算法, 用其优点 , 从而得到比较理想的压缩文本。
影评分类的朴素贝叶斯文本分类算法改进,张浩强,任思行,针对影评分类的情感分析这种文本分类问题中朴素贝叶斯分类算法的局限性,根据句法依存关系在文本中抽取情感特征,将其向量化;利