SIGHAN国际汉语分词数据集backoff2005 2ndInternationalChineseWordSegmentationBakeoff-DataReleaseRelease1,2005-11-18*IntroductionThisdirectorycontainsthetraining,test,andgold-standarddataus
北大中文人民日报199801_199806数据集 PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,他们三方计划公开PFR语料库。作为公开的前期工作,从4月
条件随机场CRF加加工具代码Linux/Mac/Window 此资源为开源的条件随机场工具包“ CRF++: Yet Another CRF toolkit ”,版权所有归官网描述,https://taku910.github.io/crfpp/