阿里巴巴集团安全生产委员会-全球运行指挥中心(GOC)技术专家,负责阿里巴巴集团监控中心的管理工作。在运维及运维平台建设领域有丰富的技术经验和成果。加入阿里巴巴前曾在小米、平安好医生主导自动化运维平台的建设。
阿里巴巴集团安全生产委员会-全球运行指挥中心(GOC)技术专家,负责阿里巴巴集团监控中心的管理工作。在运维及运维平台建设领域有丰富的技术经验和成果。加入阿里巴巴前曾在小米、平安好医生主导自动化运维平台的建设。
阿里巴巴集团拥有电商、金融、文娱、新零售、云计算等种多种业务形态,如何对这些业务形态做集团层面的统一故障治理,对产品/技术/运营都是巨大的挑战。阿里巴巴集团全球运行指挥中心(GOC)通过多年的探索,积累了大量跨 BU 故障治理经验,并在过程中使用了创新了自动化、智能化体系。
本次演讲将会对阿里巴巴集团故障治理整体流程及实战中的自动化、智能化体系做以介绍,并对未来故障治理领域智能运维工作进行展望。
演讲提纲:
1、阿里巴巴全局故障治理流程
2、基于AIOps的全局故障治理架构
3、新零售/云计算等新业态给全局故障治理带来的挑战
4、实战案例讲解
5、智能运维落地方案实施建议
听众受益点: