论文研究 基于OC SVM的新情感词识别.pdf
当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到455%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为266%的情况下,正确率可以达到45.7%,证明了算法的有效性。
暂无评论