包括文本去重(pre-process_1.py)和机械压缩。(pre-process_2.py)