非常权威的北京大学分词语料可用于大规模的中文文本分词