机器学习平台与业务提升

会议室:第五会议厅B
出品人:张瑞

所有平台的生命力源自于生产效率的综合提高,降低整体成本。企业打造机器学习平台,目... 展开 >

专题出品人:张瑞

知乎 首页技术团队负责人

毕业于北京邮电大学,先后在百度、豌豆荚等从事搜索、搜索广告、推荐系统中的机器学习、自然语言处理、推荐算法等方向的工作。目前担任知乎首页技术团队负责人、首页业务总监,负责知乎信息流产品的技术研发及产品运营团队。

地点:第五会议厅B

专题:机器学习平台与业务提升

所有平台的生命力源自于生产效率的综合提高,降低整体成本。企业打造机器学习平台,目的是要降低使用最新机器学习、深度学习、强化学习等技术上,能够保证整体效率和成本控制,同时兼顾创新的活力,加强产品功能和质量。

by 鲁文龙

vivo
资深算法工程师

为了支撑 vivo AI 研究院各种各样的机器学习项目,我们在多年广告推荐项目的实践经验基础上,尝试构建了一套端到端的一站式机器学习平台系统,降低技术落地门槛,提供项目迭代效率。平台提供了基于各种计算框架 Tensorflow、PyTorch 构建的高性能训练 SDK,高效调参与 AutoML,模型部署,线上推理,A/B测试,效果监控与分析等功能。除此之外,还提供了一套基于 Spark,HBase,Redis 等构建的特征生成与管理和样本生产与管理的 pipelines,为实现实时增量训练奠定了坚实的基础。到目前为止,公司的多个项目如广告、推荐,搜索,图像等都运行在该平台上,迭代周期大大缩短。

演讲提纲:

  1. 为什么需要机器学习平台
  2. 机器学习平台的价值
  3. 特征平台
  4. 模型平台
  5. 基于配置的推理引擎
  6. 信息流推荐案例
  7. 总结

听众受益点:

  1. 了解机器学习项目的最佳实践
  2. 了解如何避免大规模机器学习项目中的各种坑
  3. 学习如何架构系统,使得算法工程师与开发工程师的工作实现解耦,提高迭代效率

by Jose David Baena

GitHub
Senior Software Engineer

Scaling up machine-learning (ML), data retrieval and reasoning algorithms from Artificial Intelligence (AI) for massive datasets is a major technical challenge in our time. The scaling process can also have different dimensions: performance, development productivity, number of employees…

In this talk I will showcase how we used to develop Machine learning features at GitHub, the pain points we had and how we changed our infrastructure and way of development in order to productionize multiple ML features in terms of hours/days.

In addition, I will explore with the audience the main factors I consider when scaling ML at medium to big companies.

By the end of the talk you should have an overview and applicable framework on how to help scaling ML processes in your company.

Talk outline:

Potential outline for the talk:

  • Introduction to ML at GitHub.
  • Challenges of running ML at scale. Different dimensions:
    • Performance: number of requests
    • Development: growing infrastructure, number of ML features
    • Organizational: number of employees
  • ML ecosystem architecture.
  • Improving agility and development on ML features.
  • Adopting ML at scale in your company.

by 单厚智

知乎
首页业务推荐Ranking负责人

知乎是一个高质量的问答社区,核心的任务是要解决知识的生产和消费问题,从而形成一个良性的闭环。在2018 年初,知乎首页组引入深度神经网络对首页信息流进行排序,取得了前所未有的效果提升。深度学习作为当前的前沿研究领域,广度和深度都值得我们在基础模型上进行深入探索,在深度学习上线后,我们进行了积极的改进和优化。考虑到知乎用户较高的消费门槛,在传统的利用 DNN 进行 CTR 预估的技术基础上,我们在以下几个方面进行了探索和尝试,取得了不错的效果:

  1. 针对 CTR/阅读 的单一指标不能准确反映用户体验的问题,我们尝试应用多目标预估技术结合我们对用户行为的理解,来解决用户各方面的内容消费需求,优化用户体验,取得了较大的成功;
  2. 针对 DNN 模型的效果随时间下降的问题,我们上线了 Online Learning 模型,便于对用户行为模式变化引发的概念漂移进行即时的捕捉和学习,从而使推荐更加精准、更加符合当前的上下文,取得显著的收益。

演讲提纲:

  1. 深度学习在知乎首页的应用现状综述
  2. 在排序中进行多目标学习的必要性及收获
  3. Online Learning 在 Ranking 模型中的推进及经验分享
  4. 在深度学习使用中的一些经验总结及未来研究方向探讨

听众受益点:

  1. 知乎在深度学习中的尝试和收获
  2. 多目标预估在深度学习中的应用经验
  3. Online Learning 与 TensorFlow 结合的实战经验

by 褚向阳

小米
人工智能部/高级软件工程师

CloudML 是小米人工智能部的机器学习平台,随着业务的发展和用户的增多,结合 K8s/Kubeflow 社区对于原生扩展及 ML/DL 平台发展方向,我们提出了基于 K8s 原生扩展的新一代机器学习平台引擎 ML Engine,主要思路是充分利用 K8s 原生的扩展机制,包括 CRD / Webhook / Scheduling Framework 等,将机器学习平台相关的业务模型、控制逻辑和调度策略融入到 K8s 集群中,提供更好的生命周期管理,同时满足高可用、稳定性和易维护性的云原生特性。

演讲提纲:

  1. 小米 CloudML 平台简介
  2. ML Engine 架构设计演进
  3. ML Engine 对多框架的分布式训练支持详解
  4. 未来发展方向和具体工作

听众受益点:

  1. 了解目前机器学习平台所需要解决的问题
  2. 理解使用 K8s 的扩展功能来实现定制需求的方法和优势
  3. 重新思考云原生的机器学习平台架构

交通指南

© 2019 Baidu - GS(2018)5572号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务报名小助手豆包
或致电:010-84780850