本文来源于infoq,介绍了百分位的好处和不足,应用数据,预测模型和异常值等。在深入了解使用机器学习来了解软件系统行为之前,必须先了解传统的时间序列方法。 时间序列数据的值缺失可能会在分析时导致意外结果,Pandas库可以帮为你填充合理的默认值。 当人们在使用你的服务时,你应该期望数据具有季节性。在设计预测算法时要考虑到这一点。 请注意你为异常检测设置的阈值。在单个服务器上不太可能发生的事件在对应用程序进行扩展之后很可能