流计算技术Heron实践
课程简介
提高计算的时效性,更快的从数据中挖掘出信息和知识就意味着能够获取更大的价值。由于对于实时性的高要求,Twitter在过去几年的时间内投入人力和研发了一整套实时数据技术栈。
最近,越来越多的企业对于实时数据技术架构感兴趣。从批处理向流计算机构的转型,是企业关于如何使用数据的一次技术革命。但是,实时数据技术栈(包括流计算引擎、数据存储引擎、编程语言和工具)的最前沿现状又是什么呢?在这其中,又有哪些技术挑战?以及这些前沿技术怎么影响流计算的架构和应用呢?本次分享,将围绕这些技术内容讲解Twitter在使用Heron上的宝贵经验。
课程讲师
吴惠君
@Twitter Data Platform Engineer
吴惠君博士,现任Twitter工程师,致力于实时流处理引擎Heron的研究和开发,Apache Heron committer。毕业于Arizona State University,专攻大数据处理和移动云计算,曾在国际顶级期刊和会议发表多篇学术论文,著有《Mobile Cloud Computing: Foundations and Service Models》,并有多项专利。
课程大纲
- 流计算的简介以及一些典型应用
- 流计算架构是什么,不同类型的流计算架构及其优缺点
- Heron在流计算技术栈中的使用场景
- Heron详解
- Heron与上下游的衔接
- 我们使用Heron来搭建实时数据技术栈时获得的经验教训
- Q&A
目标人群
Software Engineers, Engineering Management, CIOs, Technology Leaders
课程收益
- 了解流计算及其架构的历史,发展和典型应用,理解不同流计算平台的特性和优缺点
- 理解Heron的基本架构并能使用Heron进行实时处理
- 能够便捷地搭建一套高性能切实可用的实时处理系统
- 了解分布式实时处理系统设计中常见问题、难点和处理策略