jieba分词词性标注.py 将需要分词进行词性标注的句子存放在corpus文本文件(自建)中,最好是每句话存为一行。注:corpus文件需放在代码所在文件夹里。运行代码,自动生成一个outcome文本文件,分词词性标注结果就在此文本里。
MOOC中的Python语言程序设计课程北京理工大学单元测试答案 MOOC中的Python语言程序设计课程(北京理工大学)单元测试答案。包含9个单元的单选题以及编程题答案。编程题每个题目一个文件夹,选择题在一个文件夹。注:此答案用于沟通交流,辅助课程完成。
corpusfile.txt 人民日报2014语料库是一个基于分词之后词性标注过的语料库,是一个针对词性标注训练的语料库,语料库含有相应的词性标注。本文件保留原本分词痕迹,但删除了文本的词性标注,并把所有文件夹语料整合到一个文本文件里使其更适合进行NLP分词训练。