在进行文本分析、提取关键词时,新闻评论等文本通常是中英文及其他语言的混杂,若不加处理直接分析,结果往往差强人意。匹配英文时,需要将空格[\u0020]加入,不然单词之间没空格了。

利用Python将文本中的中英文分离方法