暂无评论
针对短文本特征稀疏、信息量少等问题,提出了结合情感词网的中文短文本情感分类方法。该方法利用大规模语料库和同义词集合构建可以表示词—词、词—对象之间关系的情感词网,通过此情感词网在权重以及特征集合对短文
基于tensorflow的IMDB文本情感分析完整代码(包含数据和词向量可直接运行),网络结构采用双层LSTM。
基于词向量的机器翻译Python代码,其中train_word2vec_model.py为训练词向量代码,test.py为测试翻译结果代码。(本文件夹不包含词向量模型、训练集和测试集,仅为代码!!!)
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算
训练所采用的语料如下: 12G百度百科词条 20G小说 90G的其他爬虫语料 训练得到词库1.35G,bin和model格式
暂无评论