VoIP的服务质量(QoS,Quality of Service)评估可以采用一系列可度量的参数来描述:业务可用性、吞吐量、延迟、抖动、分组丢失率等。现有的感知语音质量评价(PESQ)很难对不同环境下的网络结构进行实时和恰当的语音等级质量分类。为了能够综合考虑几种QoS相关因素,在给出改进的自组织映射神经网络模型(ESOMNN)的基础上,利用ESOM能够对高维输入数据有效分类的特点,提出了将端到端延迟、丢包率、抖动、语音编码以及测试系统标识作为ESOMNN的输入数据,在对采样数据进行训练后可自动完成语音质量评价和映射,并能根据得到的实时变量有效地评价包含多种相关因素的QoS级别。