Python输入输出-自然语言处理+json格式化 NLP自然语言处理 读取文件 去除所有标点符号和换行符,并把所有大写变成小写; 合并相同的词,统计每个词出现的频率,并按照词频从大到小排序; 将结果按行输出到文件 out.txt。 import re def parse(text): #使用正则表达式去除text文件内标点符号和换行符,替换为空格, text = re.sub(r'[^\W]',' ',text) #转换为小写 text = text.lower() #生成所有单词的列表。split将输入的字符串分割后为列表 word_lis