一种基于N-Gram改进的文本特征提取算法