基于后缀数组的分词,是不需要词典和语料库。通过后缀数组和散列表获得汉字结合模式。