暂无评论
大规模文体分类是一个非常复杂的任务。提出了一种基于语言自然节奏的文本分类方法,通过对语言中标点标记的自然节奏进行分析,获取其特征,应用贝叶斯分类器,可以快速高效地完成文本分类任务。这种文本分类方法与当
基于深度学习的票据图像文本定位研究,姜典转,黄雅平,\justifying随着人们物质和精神生活日益丰富,包括购物、餐饮、交通等在内的大量相关票据很容易堆积起来。然而在票据信息审核、发票��
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含
RTP报文的识别与判定,荣艺,王立,随着流媒体及电话会议和视频监控等实时音视频数据传输的广泛应用,RTP(Real-timeTransportProtocol,实时传输协议)得到了越来越多的应用。
提出了基于模糊逻辑和纹理分析的图像增强算法,通过图像模糊化、提取纹理信息和纹理信息模糊化、定义局部对比度、根据全局和局部信息来进行对比度的变换等措施,提高了增强算法的效果。测试结果表明该算法能很好地增
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法
针对软袋组合盖在实际生产过程中出现的胶塞缺失或压偏、内盖错位等问题,结合机器视觉检测技术设计了基于机器视觉的软袋组合盖质量视觉在线检测系统。该系统分为硬件系统和软件系统两个部分。硬件系统包括机械传动系
针对银行全成本分析的业务特点和数据挖掘各种算法的应用特征,提出了基于关联规则的分类算法在银行全成本分析系统中的分析模型。将此模型与其他机器学习分类算法进行实验比较,得出此算法在该领域的最佳效果,所挖掘
传统的机器学习方法是在训练数据和测试数据分布一致的前提下进行的,但在一些现实世界中的应用中,训练数据和测试数据是来自不同领域的。在不考虑数据分布的情况下,传统的机器学习算法可能会失效。针对这一问题,提
通过文档基于模糊限定词的特征表达,定义特征的模糊函数,将文档表示为隶属度限幅的特征向量,构造文本集隶属度限幅的类特征矩阵,将每一类文本集映射为类期望向量,所有类期望向量便构成了隶属度限幅的特征VSM。
暂无评论