提升效率的 AIOps

会议室:第五会议厅A
出品人:周琦(简志)

近年来云计算、云原生、容器等技术的涌现使 DevOps 在发布、部署上的效率大大... 展开 >

专题出品人:周琦(简志)

阿里云 资深技术专家

周琦(简志),阿里云资深技术专家,负责阿里集团/蚂蚁金服/阿里云日志处理、分析平台。周琦早年参与阿里云飞天操作系统从无0到1研发,对大规模系统监控诊断、性能分析有非常多的经验。目前负责的产品阿里云日志服务 SLS 每天处理万级用户,十几 PB 日志类数据(Metric、Tracing、Log)分析类任务,服务整个阿里集团+各大知名互联网公司。对 AIOps 领域的数据处理、建模、异常检测、故障诊断、知识图谱等有实践经验,正推进在业务场景的落地。

地点:第五会议厅A

专题:提升效率的 AIOps

近年来云计算、云原生、容器等技术的涌现使 DevOps 在发布、部署上的效率大大提升,但"线上监控、诊断和分析"却因数据量膨胀、异构环境复杂性、业务7*24小时连续性要求等变得越来越苛刻。

与无人驾驶(或辅助驾驶)技术类似,AIOps 目标就是通过数值驱动手段,借助算法、建模、推理等方法辅助 DevOps 提升效率,把经验问题转变为一个算力问题。在更快发布同时兼顾更低的风险,使得 IT 设施具备既快又安全的“自动驾驶”的能力。

by 王英杰

陆金所
数据架构团队负责人

问题背景:SQL 的性能问题一直是影响到金融系统用户体验甚至是系统可用率的关键因素。传统模式下为了确保 SQL 性能要么需要开发具备丰富的数据库开发经验,要么需要 DBA 投入大量人力对上线的 SQL 执行计划进行逐个 review。

解决方案选型:使用 AI 算法模拟 DBA 对每个上线版本的 SQLmap 进行智能 review,让 AI 评估 SQL 是否存在性能问题,哪里存在性能问题,如何优化性能问题。

解决方案介绍:基于陆金所数年的 SQLmap 代码、执行计划、生产运行监控信息、DBA review建议等数据结合 AI 算法训练和优化 AI SQLreview 系统。

实施后的效果说明:新版本上线后出现烂 SQL 的概率下降了60%,并且 DBA 从 SQLreview 的工作中彻底解放,再也不需要投入大量的人力进行 SQLreview 工作。

演讲提纲:

  1. 人肉 SQLreview 痛点
  2. 使用机器学习算法模拟资深 DBA SQLreview 效果
  3. 数据预处理、特征工程、建模、训练和验证过程
  4. AI SQLreview 的收益和未来迭代方向

听众受益点:

1. 了解机器学习在数据库智能优化领域的实战应用

2. 思考相较于人通过经验做 SQL 调优,机器学习算法进行智能调优存在哪些优势和不足,以及未来的优化方向

3. 未来在数据库运维领域还存在哪些好玩的 AIOps 场景值得深挖

by 周伟

百度
资深研发工程师

by 范月林

百度
资深研发工程师

监控报警是故障发现的重要一环,也是百度在AIOps方向的第一个切入方向,目前百度AIOps在监控报警方面已经孵化出两个应用场景:智能异常检测和智能报警合并。

如何支撑AIOps算法在监控告警系统的快速落地并产生业务价值,这对监控告警架构提出了很大的挑战!

本次分享将重点介绍百度监控告警系统在落地AIOps过程中遇到的架构挑战以及相应的解决方案。

百度监控告警系统主要由异常检测、事件管理、通告发送三个子系统组成:

  1. 在异常检测部分,我们将介绍如何支撑AIOps算法的离线实验、近线测试、在线运行需求,以及处理多维度异常判断过程中遇到的难点和解决思路
  2. 在事件管理部分,我们将介绍基于状态机的事件管理模型如何能够防止线上故障被遗漏
  3. 在通告发送部分,我们将介绍如何利用智能报警合并算法来应对报警风暴,以及如何保障通告消息的零丢失

最后,将总结监控报警系统在落地AIOps算法过程中的实践经验,以及我们对AIOps的思考。

演讲提纲:

  1. 落地AIOps对报警架构的挑战
  2. 报警系统的业务模型
  3. 异常判断子系统
    • 智能异常检测的研发流程
    • 多维度异常判断模型
    • 离线开发框架和近/在线运行平台
  4. 事件管理子系统
    • 报警事件模型
    • 基于状态机引擎的报警升级机制
  5. 通告发送子系统
    • 报警智能合并
    • 报警流控方案
  6. AIOps落地实战经验

听众受益点:

  1. 了解监控报警的业务痛点和对自身架构的挑战
  2. 了解 AIOps 落地过程中的思考和和工程实践经验

交通指南

© 2019 Baidu - GS(2018)5572号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务报名小助手豆包
或致电:010-84780850