帮中文系的一个博士做的一个汉字分析的东东,算法有点问题,速度比较慢,字数超过20W就比较卡了