Web文本分类中的几种阈值策略分析与比较
本文主要针对中文网页,分析比较了文本分类中的关于类别阈值的几种策略,分别是: 位置截尾法(RCut)、比例截尾法(PCut)、最优截尾法(SCut)以及改进型截尾法(RTCut),主要实验结果有: RTCut的效果最佳;PCut具有一定的复杂度,不适合在线文本处理;SCut具有一定的不稳定性;而Rcut性能最差, 并且使用英文文本和中文文本评测这几种阈值策略的结果是一致的。
用户评论
推荐下载
-
文本分类中的特征提取方法研究及分类实现
所有代码均有作者原创,结果准确合理。希望通过我的点点滴滴来为大家提供力所能及的帮助,对于初学模式识别的同学在实践能力提高方面有极大帮助。
56 2019-06-05 -
文本分类模型处理流程
文本分类模型处理流程 1.样本整理 2.数据预处理 直接按照字符处理可以使用keras的api Tokenizer(char_level=True) 建立字符数字索引 text_to_sequence
15 2021-01-16 -
中文文本分类器
WordFeature 一个文本分类器 希望对大家有用
22 2020-09-12 -
文本分类训练集.rar
文本分类训练样本集,主要为新闻集,将近万余个样本,已完成标签分类,可用于文本分类模型训练,主要为源文本内容,下载后需要自行中文分词等预处理
23 2020-08-21 -
LIBSVM学习文本分类
NULL博文链接:https://luchi007.iteye.com/blog/2267674
29 2020-06-01 -
文本分类实验报告
本报告包括完整的文本分类处理过程,包括24万搜狗预料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklear
12 2020-05-04 -
中文文本分类语料
文本分类语料库,包含医药、计算机、环境、经济、交通、艺术、体育等10个学科领域
26 2020-05-14 -
LSTM多类文本分类
LSTM多类文本分类,keras实现,Multi-ClassTextClassificationwithLSTM,bySusaNLi。
32 2019-09-20 -
文本分类特征选择方法
文本分类特征选择方法
37 2019-09-06 -
文本分类语料库
文本分类语料库,中文,训练集和测试集
55 2018-12-08
暂无评论