经常需要通过python代码来提取文本的关键词,用于文本分析。而实际应用中文本量又是大量的数据,如果使用单进程的话,效率会比较低,因此可以考虑使用多进程。python的多进程只需要使用multiprocessing的模块就行,如果使用大量的进程就可以使用multiprocessing的进程池--Pool,然后不同进程处理时使用apply_async函数进行异步处理即可。实验测试语料:message.txt中存放的581行文本,一共7M的数据,每行提取100个关键词。message.txt是每行是一个文档,共581行,7M的数据不使用sleep来挂起进程,也

python多进程提取处理大量文本的关键词方法

python多进程提取处理大量文本的关键词方法