常用的文本处理方法,比如过滤关键词。文本编码。去除htmlCode中所有的HTML标签(包括标签中的属性)。截取字符串。将Gb2312编码的字符串转换为utf-8。判断是否有非法字符。分割字符串。检测含中文字符串实际长度。截断字符串,如果str的长度超过need,则提取str的前need个字符,并在尾部加“...”。将字符串中的html代码去掉。