文本情感分析,又被称为意见挖掘,是对包含用户观点、喜好、情感等主观性文本进行挖掘、分析及判别的多学科交叉研究领域。这一领域涉及概率论、数据统计分析、计算机语言学、自然语言处理、机器学习、信息检索、本体学等多个学科及相关技术。在情感分类方面,主要有两种研究思路: 基于情感知识和基于特征。前者依赖已有的情感词典或情感知识库,通过对文本中带有情感或极性的词进行加权求和,而后者则通过提取具有类别表征意义的特征,并利用机器学习算法进行分类。本项目采用情感词典与机器学习两种方法分别进行文本情感分析,并提供结果对比。