Ta上传的资源 (0)

文本挖掘是利用数据挖掘技术在大量的文本集合中发现隐含的知识的过程。近年来许 多研究人员利用计算机技术对生物医学文献全文或摘要进行了分析,现综述各项研究中所来用的文 本挖掘技术。文本挖掘的任务包括在大量文本中进行信息抽取、语词识别、发现知识间的关联等,还 包括提高大分子序列同源查找的效率,进行细胞定位

关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 (,-),并利用.,/0, 算法来筛选出关键词以完成将123 文档进行快速有效分类的目的。实验表明,该方法在不 影