会议：2019年07月12-13日

培训：2019年07月14-15日

地址：深圳·大中华喜来登酒店

热线：+86-17326843116

下一站ArchSummit北京

机器学习应用与算法

会议室：唐4

出品人：张瑞

伴随着移动互联网和物联网技术的发展，科技的触角正在深入生产和生活的各种场景，人类... 展开 >

旗下议题

出品人介绍

专题出品人：张瑞

知乎首页技术团队负责人

张瑞，毕业于北京邮电大学，先后在百度、豌豆荚等从事搜索、搜索广告、推荐系统中的机器学习、自然语言处理、推荐算法等方向的工作。目前担任知乎首页技术团队负责人、首页业务总监，负责知乎信息流产品的技术研发及产品运营团队。

地点：唐4

专题：机器学习应用与算法

伴随着移动互联网和物联网技术的发展，科技的触角正在深入生产和生活的各种场景，人类能获得的数据越来越多。如何利用机器学习算法从这些数据中自动发现规律并加以应用，已经成为了所有科技公司都需要思考的命题。通过了解机器学习技术在各个公司的落地应用案例，例如推荐/搜索、NLP领域，来学习如何利用这些技术打造发展的强劲引擎。

by 王圣尧

美团

算法专家

更小和更大--美团智能调度演进之路

配送效率和用户体验是美团配送业务的核心竞争力，智能调度系统对于提升效率和优化体验起到关键作用。随着单量上涨、骑手增多、配送场景复杂化，调度算法也面临日益增大的挑战。什么是好的调度算法？美团智能调度算法的架构如何演进？如何让技术进步驱动业务迭代？

本次将会分享美团配送技术团队的探索与思考。

演讲提纲：

美团即时配送系统整体架构
配送调度问题的挑战
越来越小：基础建模的演进之路
越来越大：决策空间的演进之路
智能调度系统的能力沉淀

听众收益：

复杂系统建模优化的实践经验；
技术迭代对业务效果的影响方式。

by 牟娜

阿里妈妈

信息流广告rank算法负责人

阿里妈妈广告排序算法创新之旅

阿里妈妈拥有全球最大的电商广告平台，且拥有淘系丰富的用户行为数据，如何从数据中建模出用户真正的兴趣模式，从而精准的进行合适的广告推荐，对广告主、平台、用户均具有重大意义。尤其是在展示广告领域，准确地捕捉用户兴趣对点击率预估模型的性能至关重要。

在这样的背景下，我们在优化点击率预估模型的过程中对用户兴趣建模做出了多年的努力。

本次分享阿里妈妈精准定向广告的算法升级话题，详细介绍如何一步一步做到让用户开心的点击广告！也会详细介绍我们最新的工作——兴趣演化模型 DIEN，DIEN 通过巧妙的设计了兴趣提取模块和兴趣演化模块，从用户每一次具体历史行为背后挖掘其当时潜藏的隐层兴趣，并根据不同的预估广告目标，建模与当前广告相关的兴趣从远至近的演化趋势，从而准确地捕捉到用户此刻的兴趣。通过 A/B Test 该模型在猜你喜欢单品广告场景带来了20+%的 CTR 增长以及17+%的 RPM 增长，并在双十一期间全量服务，带来了可观的商业价值。

演讲提纲：

1、阿里妈妈个性化广告业务简介

2、精准定向广告排序算法创新之旅

大规模 MLR——赋予模型非线性能力
稀疏分组嵌入网络 GwEN——定向广告0-1深度学习突破
深度兴趣网络 DIEN——捕捉用户兴趣
深度兴趣演化网络 DIEN——建模用户兴趣趋势

3、系统架构创新赋能算法落地

工业级深度学习落地——深度学习平台 XDL 问世
大象跳舞——超级复杂模型如何 online learning

4、算法&系统 co-design

如何 life-long 建模用户兴趣
推荐&广告如何联动

听众受益点：

深度了解阿里妈妈广告排序算法升级之路
深度了解兴趣演化模型 DIEN 的算法细节
了解算法&系统如何联动，带来商业价值

by 冯仕堃

百度

NLP资深研发工程师

从表示到匹配的语义计算之旅

语义计算技术极大地提升了百度内部诸多产品的应用效果，本次分享将介绍语义计算的两个重要研究课题：语义表示和语义匹配。语义表示将会重点介绍百度研发的 ERNIE 技术以及为了落地而研发的 ERNIE-Tiny 技术；语义匹配这边将会重点介绍百度 SimNet 模型。

此外在分享最后，将会对百度图学习进行介绍。

演讲提纲：

1. 百度语义表示技术介绍

语义表示技术的历史发展以及百度的早期尝试
ERNIE技术介绍以及ERNIE-Tiny应用技术
应用落地举例

2. 百度语义匹配技术介绍

SimNet语义匹配模型介绍
应用落地举例

3. 从文本到图，百度图学习技术介绍

听众受益点：

前沿语义表示技术
前沿语义匹配技术

by 邝展豪

腾讯安全

天御高级研究员

从零到一构建基于对抗性训练的广告流量反作弊系统

近些年，国内移动网络广告行业取得了爆发性的发展。面对这7000亿元的庞大市场，大量广告刷量黑产团伙也嗅到了这庞大利润，不断涌入广告市场进行大肆破话。据数据统计2018年虚假广告流量占总广告流量30%，广告主一年损失约260亿人民币。而对抗黑产，反作弊的路上也充满了荆棘。随着反作弊团队打击力度加大，黑产作案手段与技术也不断地提高，有时候为了迷惑广告主，甚至会在业务表象数据上模拟真实用户，达到以假乱真的效果。

面对黑产不断地演进，反作弊团队不能墨守成规，必须灵活应对黑产不断变换“姿势”地一波又一波的攻击。这是一个攻防的过程，也是反作弊团队对抗性学习的过程。为此我们研发出一套可对抗性学习提升的广告流量反作弊查杀系统。

对于广告黑产不断变换姿态攻击广告平台，不断查找漏洞试图避开反作弊团队布下的层层防御设施，反作弊团队不能一直被动防守，要主动出击，主动寻找黑产的作弊方式。通过我们“查”模块，系统主动发现大量聚集且疑似刷量的行为，通过规则，情报与人工筛选锁定作案方式，并将相关信息记录至样本库当中。“杀”模块将“查”模块检测出的新的作弊方式融入模型训练当中。使我们的模型更全面地识别目前刷量行为。只要我们反作弊系统一直有流量进来，我们就能探测新的广告作弊方式，增强我们对虚假流量的识别能力，最终整个系统形成一个自我学习的良好闭环。

演讲提纲：