本文的主要研究工作如下: (1)针对文本情感分析中对文本表示时遇到的维度过高和语义不相关 的问题,本文采用 word embedding 机制,通过神经网络语言模型对大量评 论文本进行训练,并在此基础上通过 distributed representation 的方式表示文 本,从而将文本映射为一个低维实数向量。这种文本表示方法同时也可以 表达文本的语义信息,有助于神经网络模型对文本更好地理解。 (2)针对情感分析任务的特殊性,本文提出了一种新的文本表示方法- ——多元特征词向量。这种表示方法是对 distributed representation 表示方法