此为山西大学中文信息处理实验报告以及调研报告期末作业内含7份实验报告以及数据集实验输出文档实验1针对人民日报语料编写程序实验2基于词表的分词实验34基于HMM与字标注的分词程序特征抽取及文本表示方法实验5文本特征抽取实验6文本表示实验7基于Word2Vec的文本表示实验8基于逻辑斯蒂回归模型的文本分类期末作业调研报告