这两年“中台战略”概念异军突起,企业为何要建中台?除了解... 展开 >
2005年毕业于华中科技大学,09年加入阿里巴巴,参与阿里大数据体系建设,8年时间里依次负责过数据架构、数据平台、数据治理等方向。2017年加入滴滴出行,目前担任数据平台部和数据治理部负责人,也是滴滴新一代数据体系建设主要责任人。
超过10年的大数据领域建设经验,感受过传统行业的BI应用,也见证了大数据时代从兴起到成熟和落地的整个过程,从架构、平台到治理和对外业务,几乎走过了大数据的各个角落,希望能够有机会与大家坐而论道,共同探讨技术演变和行业发展。
曾经担任淘宝技术嘉年华、云栖大会大数据方向出品人。曾用花名 图海/陶笛。
这两年“中台战略”概念异军突起,企业为何要建中台?除了解决企业响应⼒慢的困境,弥补创新不足的短板,快速响应变化的前台,解决相对较慢的后台之外,中台还有哪些作用?如何打造中台?
云音乐作为一个快速发展创新导向的团队,数据驱动已经成为业务发展的共识。数据开发团队面临了相当大的挑战,一方面各个业务单元在8亿用户基数上积累海量的数据,另一方面业务部门基于发展需要提出了大量数据需求,并且在数据质量、数据共享、实时化方面的要求越来越高。
结合业界的实践,我们在原有平台建设基础上,通过对技术整合,团队组织架构调整搭建了云音乐的数据中台体系。中台架构中包含底层平台基建、标准化数仓体系以及数据应用服务矩阵,也包括我们适应中台体系的团队组织形式。目前我们的体系支撑千亿级数据处理、PB 级数仓、数万张业务数据报表、数十个团队协同共享数据。
演讲提纲:
听众受益点:
虎牙作为直播行业领军的企业,业务线覆盖海内外,国内Huya直播、国外Yomi直播、Nimo直播如火如荼,品类繁多、用户端多样,数据类需求层出不穷,如分析类经营分析、竞品分析、转化分析,推荐类如主播推荐、广告推荐,美颜、滤镜等AI场景。面对这样纷杂的数据应用需求,只是提供基于Hadoop搭建的数据平台,提供存储、计算、调度的基础能力,且没有一套行之有效的数据治理手段,数据差、应用难、门槛高,大量数据需求涌向数据团队,导致支撑人员疲于奔命。
如果各个需求团队自己招人、烟囱式发展、势必导致数据割裂、口径不一、应用混乱、成本高昂,那么业界高频探讨的数据中台是一个可能的方向;我们如何结合虎牙现状,走出一条适合直播行业,能够利用大量的非结构化数据、保障数据质量、降低应用门槛,从而达到减少人力投入、响应需求更快的目的、推动数据决策赋能业务发展。
本演讲将介绍数据中台建设历程中所遇到的挑战,分享数据治理、数据融合、数据服务相关的设计思路和技术方案。
演讲提纲:
听众受益点:
在云上每天会产生海量的结构化数据,例如机器的监控指标,云服务的订单,这些结构化的数据每时每刻都在产出,峰值的读写压力可以达到数千万 TPS,如何高效低成本的存储这些数据呢?对于业务来说,满足数据基础的存储需求之外,如何提供实时的分析能力,基于分析结果发现潜在监控异常或者是订单增长趋势呢?这些读写、实时分析能力都是数据中台需要必备的能力。
对于阿里云来说,存储计算分离架构下的云原生结构化数据存储引擎满足这些多样化的存储和计算需求的方法是什么?在高吞吐写入存储这些数据的同时,实现数据的实时计算和交互分析查询又是如何完成的?随着数据的积累,如何进行存储分层?降低成本诉求的同时,如何满足历史数据离线分析?
本次演讲将介绍全新的云上 Lambda 架构,分享阿里云的结构化存储引擎解决这些问题的方法,并打造出具有独特优势的云上大数据存储分析架构。
演讲提纲:
听众受益点:
图数据库是一种新兴的底层数据库技术,可以支持海量数据的实时关联、查询和计算,是新一代人工智能、认知智能的核心底层支撑技术。中国信通院 2019 年发布了图数据库白皮书,基于知识图谱、复杂异构图的各种企业级应用在公安、金融、政府、互联网等多个领域蓬勃发展,对图数据库选型的指引有迫切的需求,尤其是在各种应用场景数据和查询需求迥异的情况下。
这次演讲将全面分享图数据库选型的标准、方法和结果,涵盖了主要的多款图数据库,并结合应用场景,举例说明选型的重要性和我建议的解决方案。
演讲提纲:
听众受益点:
大数据平台技术快速迭代,大数据平台的架构环境变得日趋繁杂。不同组件间复杂的版本依赖和调用关系,上层工具应用和底层引擎间的 CS 紧耦合模式,组件间用户资源和上下文环境的彼此割裂,各种治理管控共性功能在不同组件中的重复开发等问题,给大数据平台的建设和运维带来了愈发严重的挑战,用户体验也受到影响。
在这种情况下,微众银行基于开源+自研,构建了 WeDataSphere 大数据平台套件,打造计算中间件层,让众多上层工具应用和底层引擎间的调用关系变得更加简化和解耦;提供治理管控共性功能的跨组件复用能力;打通不同数据应用组件间上下文环境,提供更连通融合易用易管的用户体验;让数据应用开发的规范、经验,更好的沉淀到应用开发工具中去。
实施效果:通过 WeDataSphere 大数据平台套件的构建和应用,在银行金融业务场景替代了 Oracle、SAS 等传统解决方案,在降低成本的同时提升了效率和自主可控性。其中部分关键组件如 Linkis、DataSphereStudio 等已经开源,受到开源社区用户的肯定和好评。
演讲提纲:
听众受益点:
随着360公司全新战略方向的确定,公司的业务市场从面向C端用户的产品开始扩展到B端客户,大数据中心也承载了B端应用场景中的数据处理需求,面对不同领域的客户、不同客户的需求、不同需求的应用场景,如何让大数据平台既保持平台的简单、纯粹,又能快速、灵活的响应客户需求。
本次演讲将通过介绍大数据中心的定制化能力构建,来阐述上述场景的解决方案。
演讲提纲:
听众受益: