Ta上传的资源 (0)

该PPT是有关于人工智能的英文简介,可用作硕士英文演讲使用,内容包括从发展史到发展现状,从发展前景到如何应对。切包含讲解使用得语言文档。

将需要分词进行词性标注的句子存放在corpus文本文件(自建)中,最好是每句话存为一行。注:corpus文件需放在代码所在文件夹里。运行代码,自动生成一个outcome文本文件,分词词性标注结果就在此文本里。

人民日报2014语料库是一个基于分词之后词性标注过的语料库,是一个针对词性标注训练的语料库,语料库含有相应的词性标注。本文件保留原本分词痕迹,但删除了文本的词性标注,并把所有文件夹语料整合到一个文本文件里使其更适合进行NLP分词训练。