拥有多年开发和运维工作经验,致力于运维质量和自动化效率提升,目前负责织云Metis智能运维体系建设。
拥有多年开发和运维工作经验,致力于运维质量和自动化效率提升,目前负责织云Metis智能运维体系建设。
Metis是从腾讯海量业务的一体化运维体系孵化而成的,时间序列异常检测是Metis组成部分之一,承载了腾讯QQ业务的智能监控告警功能。主要实现思路是通过学习织云海量的时间序列样本,训练出一套智能检测模型,对时间序列进行检测。在腾讯内部已涵盖超20万台服务器,超240万业务指标,保障了99.99%以上的业务可用率。