基于标签和语言模型的分词算法 宗成庆书里面准确率最高的分词算法,代码有点错误,[ct]分母上的统计量应该是统计前几个字出现的字数而不是自身的个数,修改就可以进行分词,细节看里面的标注,参照给出的语料可以使用