文本数据挖掘中的一个关键问题是如何从连续到达的文档流中提取有意义的结构。电子邮件和新闻文章是典型的文档流,它们的特点是某些主题在一段时间内突然出现并逐渐消失。类似的现象也可以在特定研究领域的文献中观察到。本文提出了一种形式化的方法来对这种“突发现象”进行建模和识别,通过将文档流建模为一个无限状态自动机,并通过状态转换来表示突发现象的出现。基于该方法,我们设计了一个高效的算法,可以从文档流中识别出突发现象,并提供了一个组织框架来分析其内容。实验证明,该算法在电子邮件和研究文献的应用中具有良好效果。
用户评论
推荐下载
-
免疫算法在物流选址中的应用
人工免疫算法在物流中心选址的应用。含有immune_main.mfitness.msimilar.mconcentratin.mexcellence.mSelect.mCross.mMutation.
21 2019-09-27 -
蚁群算法在GIS中的应用
蚁群算法在GIS中的应用,王诚,,蚁群算法是由意大利学者Dorigo等人于20世纪90年代初期通过模拟自然界中蚂蚁集体寻径的行为而提出的一种基于种群的启发式仿生进化系�
24 2020-04-14 -
遗传算法在排课中的应用
遗传算法在排课中的应用
28 2019-09-14 -
混沌算法在信息加密中的应用
混沌运动是指在确定性算法中局限于有限空间的高度不稳定的运动,混沌是由确定性方程产生的,只要方程参数和初值确定就可以重现混沌现象。
32 2019-09-13 -
Apriori算法在超市决策中的应用
摘要:针对超市营业中每天生成的大量商品销售 记录 ,使用Apriori 关联规则挖掘算法来分析数据项 之间的关系 ,从数据中挖掘出有价值的信息 ,总结顾 客的购物行为的规律性 ,为商场主管制定正确的营
24 2019-01-17 -
模糊算法在智能车中的应用
模糊算法在智能车中的应用
13 2020-08-29 -
蚁群算法在WSN中的应用
这个是关于WSN聚类的一个蚁群算法的应用。
30 2019-05-15 -
PID算法在智能小车中的应用
PID常用口诀:参数整定找最佳,从小到大顺序查,先是比例后积分,最后再把微分加,曲线振荡很频繁,比例度盘要放大,曲线漂浮绕大湾,比例度盘往小扳,曲线偏离回复慢,积分时间往下降,曲线波动周期长,积分时间
50 2019-05-16 -
PID算法在智能车中的应用
描述了数字PID控制技术提高精度、拓展相位裕量中的运用过程
26 2019-07-13 -
LMMSE算法在信道均衡中的应用
LMMSE算法在信道均衡中应用的MATLAB仿真,适合信号处理专业参考,在QPSK传输的基础上进行仿真。
24 2019-07-07
暂无评论