高铁的安全问题越来越受到人们关注,通过安装在高铁上的传感器可以采集到列车运行过程中的振动信号。分析和处理采集到的振动信号,可以对列车运行过程中出现的故障进行诊断。经验模态分解(EMD)适用于将非线性非平稳的信号分解为若干个固有模态函数之和,它在信号分析和处理领域起着至关重要的作用。但列车在不断运行过程中采集的数据量非常大,信号处理的速度成为了瓶颈。因此,借助大数据处理框架Spark基于分布式的内存运算、弹性式分布式数据集等特点,提出了基于Spark的并行化EMD算法,并利用实际数据进行算法评测,通过Speedup、Sizeup、Scaleup三个指标对实验结果进行分析,得到该并行化方法在三个指