人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型... 展开 >
杨军在阿里巴巴计算平台PAI团队担任资深算法专家,目前主要负责模型系统联合优化相关工作,他的优化关注点涉及到集群层面的硬件资源效率以及作业本身的执行性能。他对于结合AI模型作业特点分析,从模型系统联合视角进行co-design优化的技术方向有着比较浓厚的兴趣。
人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型企业之人工智能平台背后的核心系统架构和核心技术,例如模型、算法和数据训练等,以及实践人工智能应用需要哪些新思维。
vivo AI 研究院从2018年初开始从机器学习向深度学习转型,需要一套通用的深度学习平台统一支持广告、推荐、视觉、语音、NLP 等领域高效落地深度学习。在这个过程中,探索出了一套基于容器技术的深度学习平台,统一支持 Tensorflow、PyTorch、Caffe、Kaldi 等深度学习框架,支持大规模深度学习,高效落地基于大规模 GPU 深度学习的模型训练。经过1年多的研究和实践,vivo 建设了一套领先的完善的深度学习计算平台,并且落地在 vivo AI 研究院 广告、推荐、视觉、语音、NLP 业务中,大大提升了业务的训练效率。
演讲提纲:
听众受益点:
如何建模特征之间的交互关系,在推荐系统中至关重要。传统的 Logistic Regression 模型,简单有效,依赖专家经验进行特征交互设计。Factorization Machine 模型有效建模了二阶特征交互。而深度学习模型以其优秀的特征表达能力,在推荐系统占据一席之地。在深度学习模型中,特征交互的设计也是尤为重要。我们对现有的几种设计方式进行总结,并且提出了创新性的方案。AutoML,在计算视觉中的图像分类问题中,自动设计出各种新颖的神经网络,不断刷新各类竞赛的精度上限。演讲中也会介绍 AutoML 技术在特征交互的设计上如何发挥优势。
演讲提纲:
听众收益:
在诸如推荐系统,在线广告,金融反欺诈等机器学习应用中,数据集可以跨越多个相关表来显示事件的时间安排。而传统方法则需要专家们通过繁琐的手法来获取有意义的特征。我们提出基于多表自动机器学习算法,能够自动发现表间关系来自动进行特征合成。在没有域信息的情况下,多表自动机器学习算法,能够自动生成有用的时序特征和跨表格有效拼接与聚合特征。并且在规定时限和资源消耗下,自动选择最佳的机器学习模型。凭借创新性的多表 AutoML 技术,我们能够产生更加高效的、实用的、端到端的自动机器学习方案。
演讲提纲:
听众受益点:
腾讯 PCG 有大量的推荐业务场景,比如腾讯看点、腾讯新闻、腾讯视频、QQ 空间、微视、腾讯浏览器等。优秀的推荐系统需要在线训练海量的稀疏数据,支持大规模分布式,持续增量上线,以及快速 A/B 实验扩缩容。更加复杂的推荐模型要求我们逐步使用 GPU 等加速硬件。
这次演讲我将介绍 PCG AI 中台的无量推荐系统如何解决这些技术难点,同时让技术足够通用、可扩展,能够以工业化的中台高效率服务多个不同业务。
演讲提纲:
听众受益点: