研究了一种云资源池端到端智能化运维管理系统,提出一种智能判断故障模块的技术架构,分析了实现云资源池端到端告警关联的基本方法,阐述了云资源池单KPI异常检测分析方法和多KPI故障传播链分析方法的实现原理,并重点介绍了物理主机告警与虚拟主机告警、IP SAN存储告警与虚拟对象存储告警、主机设备告警与网络告警的关联关系,为运营商提升云资源池端到端智能化运维能力提供了借鉴和参考。