计算机领域内文章关键词抽取系统
内容摘要
随着信息化进程的深入发展和互联网的迅速发展,人们的信息资源得到最大程度的共享,同时搜索引擎成为人们查找信息的首选工具。其中,垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
本文主要阐述垂直搜索引擎、中文分词的基本原理。并在此基础上提出了基于垂直搜索思想和正向最大匹配的中文分词相结合的方法。利用哈希表存储相关词库、以正向最大匹配法实现了中文分词。进而利用C#以及SQL语句实现了对计算机领域相关文章的关键词提取。该系统以Win2000为开发平台,C
暂无评论