腾讯无量推荐框架和自动化线上系统的前沿应用

所属专题:人工智能应用

嘉宾 : 潘欣 | 腾讯PCG/AI中台技术负责人

会议室 : 唐4

讲师介绍

专题演讲嘉宾:潘欣

腾讯PCG/AI中台技术负责人

多年深度学习算法和工程经验,前 Google Brain 团队深度学习算法研究和 TensorFlow 核心开发。PaddlePaddle 深度学习框架开发负责人。目前腾讯 PCG(平台与内容事业群 Platform and Content Group)的 AI 中台技术负责人。

目前主要专注在腾讯 PCG 的 AI 中台,推荐系统的设计和开发,主要服务腾讯看点、腾讯视频、腾讯新闻、微视、QQ 空间等业务场景。早年参与 Google 文件系统,数据访问控制系统,谷歌云 IAM 系统。

议题介绍

演讲:腾讯无量推荐框架和自动化线上系统的前沿应用

腾讯 PCG 有大量的推荐业务场景,比如腾讯看点、腾讯新闻、腾讯视频、QQ 空间、微视、腾讯浏览器等。优秀的推荐系统需要在线训练海量的稀疏数据,支持大规模分布式,持续增量上线,以及快速 A/B 实验扩缩容。更加复杂的推荐模型要求我们逐步使用 GPU 等加速硬件。

这次演讲我将介绍 PCG AI 中台的无量推荐系统如何解决这些技术难点,同时让技术足够通用、可扩展,能够以工业化的中台高效率服务多个不同业务。

演讲提纲:

  1. 无量推荐深度学习框架的架构,难点,方案,和未来工作:
    • GPU 在推荐系统的应用和难点(如增加打分 batch size,提高单机计算密度,拆分部分 Sparse 计算到 CPU,其余放在 GPU。多 GPU Embedding 分片等)
    • 和 TensorFlow 等开源框架融合时的 API 设计,在功能扩展的同时不影响原生 Feature Column,Estimator,Keras API 的使用
    • 参数的动态变长,自动淘汰,训练时量化压缩等功能扩展
  2. 推荐系统的核心难点,比如模型管理,线上 Serving,A/B 实验等
    • 多模型多服务的自动扩缩容(分钟级百节点),支持线上 A/B 实验频繁的流量调整
    • 使用一套统一的 Serving 架构支持大规模精排,召回和传统 CV/NLP 场景
    • 上千节点 Serving 服务技术瓶颈的解决

听众受益点:

  1. 推荐系统如何同时解决易用性(支持开源 TF/PyTorch),推荐特性(海量稀疏数据,千亿特征),线上服务(快速 A/B,自动化上线)
  2. 在推荐系统应用时其他常见的问题,如特征对齐,云架构,数据分发
  3. 更复杂推荐模型(带 Attention,RNN,Multi-Expert,多目标,多模态)的 GPU 加速
  4. 展望推荐系统未来技术的演进方向
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86-15600537884