所有平台的生命力源自于生产效率的综合提高,降低整体成本。企业打造机器学习平台,目... 展开 >
毕业于北京邮电大学,先后在百度、豌豆荚等从事搜索、搜索广告、推荐系统中的机器学习、自然语言处理、推荐算法等方向的工作。目前担任知乎首页技术团队负责人、首页业务总监,负责知乎信息流产品的技术研发及产品运营团队。
所有平台的生命力源自于生产效率的综合提高,降低整体成本。企业打造机器学习平台,目的是要降低使用最新机器学习、深度学习、强化学习等技术上,能够保证整体效率和成本控制,同时兼顾创新的活力,加强产品功能和质量。
为了支撑 vivo AI 研究院各种各样的机器学习项目,我们在多年广告推荐项目的实践经验基础上,尝试构建了一套端到端的一站式机器学习平台系统,降低技术落地门槛,提供项目迭代效率。平台提供了基于各种计算框架 Tensorflow、PyTorch 构建的高性能训练 SDK,高效调参与 AutoML,模型部署,线上推理,A/B测试,效果监控与分析等功能。除此之外,还提供了一套基于 Spark,HBase,Redis 等构建的特征生成与管理和样本生产与管理的 pipelines,为实现实时增量训练奠定了坚实的基础。到目前为止,公司的多个项目如广告、推荐,搜索,图像等都运行在该平台上,迭代周期大大缩短。
演讲提纲:
听众受益点:
Title: Adopting Machine Learning at Scale
Scaling up machine-learning (ML), data retrieval and reasoning algorithms from Artificial Intelligence (AI) for massive datasets is a major technical challenge in our time. The scaling process can also have different dimensions: performance, development productivity, number of employees…
In this talk I will showcase how we used to develop Machine learning features at GitHub, the pain points we had and how we changed our infrastructure and way of development in order to productionize multiple ML features in terms of hours/days.
In addition, I will explore with the audience the main factors I consider when scaling ML at medium to big companies.
By the end of the talk you should have an overview and applicable framework on how to help scaling ML processes in your company.
Talk outline:
Potential outline for the talk:
知乎是一个高质量的问答社区,核心的任务是要解决知识的生产和消费问题,从而形成一个良性的闭环。在2018 年初,知乎首页组引入深度神经网络对首页信息流进行排序,取得了前所未有的效果提升。深度学习作为当前的前沿研究领域,广度和深度都值得我们在基础模型上进行深入探索,在深度学习上线后,我们进行了积极的改进和优化。考虑到知乎用户较高的消费门槛,在传统的利用 DNN 进行 CTR 预估的技术基础上,我们在以下几个方面进行了探索和尝试,取得了不错的效果:
演讲提纲:
听众受益点:
CloudML 是小米人工智能部的机器学习平台,随着业务的发展和用户的增多,结合 K8s/Kubeflow 社区对于原生扩展及 ML/DL 平台发展方向,我们提出了基于 K8s 原生扩展的新一代机器学习平台引擎 ML Engine,主要思路是充分利用 K8s 原生的扩展机制,包括 CRD / Webhook / Scheduling Framework 等,将机器学习平台相关的业务模型、控制逻辑和调度策略融入到 K8s 集群中,提供更好的生命周期管理,同时满足高可用、稳定性和易维护性的云原生特性。
演讲提纲:
听众受益点: