Unsupervised TXT classifier:分类任意两个TXT文档无需培训 JAVA 开源

audio70940 9 0 ZIP 2021-04-29 15:04:41

使用已知的分类算法制作该程序是为了解决两个最常见的问题。首先是过度训练,其次是缺乏用于类别训练的数据。而是,每个TXT文件都是自己的类别,而不是分配的类别。从某种意义上说,这类似于聚类,但实际上不是聚类算法,因为其中涉及一些训练。来自Classifier4J的汇总器已经过调整,可以接受两个输入(我们称它们为A和B)。然后,对摘要器进行A训练以对文档B进行摘要,反之亦然。这为两个文档提取了一个相关结构(从而避免了过度训练),然后使用向量空间分析对其进行比较,以给出一个文档属于另一个文档的范围(从而避免信息不足)。此方法可用于通过合并某些类别的文本来创建用户定义的类,然后计算文档之间的相关距离,但这不是必需的。

文件列表

Unsupervised TXT classifier:分类任意两个TXT文档，无需培训-JAVA-开源 (预估有个137文件)

VectorClassifier.class 3KB

Utilities.class 4KB

WordProbability.class 5KB

JDBCWordsDataSource.class 6KB

BayesianClassifier.class 6KB

EqualsBuilder.class 6KB

Resource.class 5KB

CompareToBuilder.class 8KB

HashCodeBuilder.class 6KB

SimpleSummariser.class 2KB

DefaultTokenizer.class 3KB

VectorClassifier.class 4KB

Utilities.class 5KB

WordProbability.class 3KB

BayesianClassifier.class 7KB

EqualsBuilder.class 8KB

Resource.class 4KB

CompareToBuilder.class 9KB

HashCodeBuilder.class 7KB

SimpleSummariser.class 4KB

用户评论

暂无评论

OpenCV处理图像分类.txt

使用Opencv进行特征提取,并且对图像中的物体进行标注,具有很高的识别率。

18 2021-01-12
垃圾分类数据集.txt

垃圾分类数据集，可用于训练深度学习模型垃圾分类模型，10000+样本，数据集较大，CSDN无法上传，给了百度云链接

117 2020-05-14
POJ分类题目txt文件

PKU的onlinejudge的题目一些分类

24 2019-09-07
南开100题分类txt

此题问网上机考的很多原型所在大家好好看哦

29 2019-01-22
京东商品分类txt格式

京东商城的商品分类数据，txt格式可以用记事本打开，一行一条数据

24 2019-06-01
GB28181协议两个文档.zip

G28181标准2011和2016两个版本的文档资源，亲测可用，大家可以一起学习

33 2019-09-19
xml精讲帮助文档两个打包

从实例讲解剖析xml，帮助真正理解使用xml进行数据的交换，提交。结合java，php,flash。

23 2020-03-24
.net比对两个word文档的内容

.net比对两个word文档的内容，增删改动作红色删除线标记，对比结果生成pdf文档，方便在线比对后展示比对结果

20 2019-05-15
Gensim计算两个文档相似度python

Gensim计算文档相似度的方法讲解，python代码实现

57 2019-04-28
两个平面求交直线详细文档

两个平面求交直线详细文档

7 2023-01-02

Unsupervised TXT classifier:分类任意两个TXT文档无需培训 JAVA 开源

文件列表

用户评论

推荐下载