支持中文的分词源码,效果还不错,准确率、速度都合适