自己的分词器,基于ik分词器的原理,实现的基于正则表达式的分词