R语言文本挖掘

hostlove84081 38 0 PDF 2019-09-14 09:09:13

R语言环境下的文本挖掘,文本挖掘被描述为“自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自然语言处理、文体变化分析及网络挖掘等领域内容。对于文本处理过程首先要拥有分析的语料(textcorpus),比如报告、信函、出版物等。而后根据这些语料建立半结构化的文本库(textdatabase)。而后生成包含词频的结构化的词条-文档矩阵(term-documentmatrix)。

用户评论
请输入评论内容
评分:
暂无评论