暂无评论
提出了一种基于增量词集频率的文本主题词提取算法,其核心思想是计算主题词集频率增量,算法从候选主题词集提取主题词时,计算单个候选主题词对主题词集频率的增量,若增量小于给定阈值,则主题词提取算法结束,否则
分类规则挖掘算法研究与应用,王蓓,琚春华,本文提出一种多支持率分类规则挖掘算法MSC,采用分类频繁模式树组织频繁模式集、应用数组表示模式支持子集,并采用多支持率进行分
针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台
相似性连接,即利用相似函数度量数据之间的相似程度,满足条件后进行连接操作。MapReduce框架下已存在很多相似性连接算法,但仍然存在一些不足,如大量的索引加大时间、空间的开销;现有算法不能有效地完成
一种基于Can树的分布式关联规则增量挖掘算法,郑晓飞,,关联规则挖掘是数据挖掘领域重要的研究方向。随着网络技术的发展与普及,各计算机系统中的数据呈现出分布与递增特性。通过对大量
基于谱的错误定位(SBFL)方法能帮助程序员减小软件调试的困难。作为一种轻量方法,SBFL只需收集测试用例的覆盖信息和测试结果,计算程序每条语句的运行特征。众多SBFL方法,将四个运行特征组合成不同的
基于改进自主训练算法的时间序列分类,王会青,郭芷榕,自主训练(self-training)算法可以有效的利用未标记样本,对时间序列数据进行分类,是一种简单、高效的算法。而现有的自主训练算法��
针对光线暗、对比度和分辨率低的监控视频,提出了一种基于背景分类的运动目标检测算法。 首先用视频第一帧图像HSV空间的色度H和亮度V作为背景特征进行初始化,建立两种包含色度和亮度特征的背景模型类,即初始
为了提高语音情感识别系统的识别准确率,在传统支持向量机(SVM)方法的基础上,提出了一种基于主成分分析法(PCA)的多级SVM情感分类算法。首先将容易区分的情感分开,针对混淆度大且不能再利用多级分类策
为了解决用户评分数据稀疏性和用户最近邻寻找的准确性问题,提出了一种基于项目分类的协同过滤推荐改进算法。该算法首先利用项目分类信息为类内未评分项目预测评分值;然后通过计算类内用户间的相似度得到目标用户的
暂无评论