NLP中常用的PTB语料库,全名PennTreebank。 PennTreebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。 语料来源为:1989年华尔街日报 语料规模:1Mwords,2499篇文章