字节跳动(今日头条、抖音母公司)基础设施研发工程师,曾负责 HDFS / Yarn 的研发工作,目前负责头条研发效率基础设施的建设工作。HDFS Contributor,Yarn Contributor,《HDFS 2.X 源码剖析》作者。
字节跳动(今日头条、抖音母公司)基础设施研发工程师,曾负责 HDFS / Yarn 的研发工作,目前负责头条研发效率基础设施的建设工作。HDFS Contributor,Yarn Contributor,《HDFS 2.X 源码剖析》作者。
字节跳动拥有了2款DAU过亿(今日头条、抖音)、多款DAU过千万的产品。国内产品总DAU已超过4亿,MAU已超过8亿,同时在全球40多个国家和地区排在应用商店总榜前列,覆盖75个语种。极速增长的用户规模和推荐为核心技术的业务背景对底层大数据平台造成了巨大的压力,日新增 5PB 数据、日均25w+离线作业、日均2k+离线用户对存储和计算都提出了不同的挑战。
此演讲中,我分别从存储和计算两个维度介绍字节跳动离线基础设施的规模,业务场景,遇到的挑战和我们解决的方法。这其中对社区的 Hadoop 实现有很多更改,其中部分大部分是社区还未实现的功能。
演讲提纲:
3. 任务调用与资源管理 Yarn 的架构演进与实践
4. 字节跳动 Hadoop 未来 Roadmap
听众受益点: