大数据智能处理 & 数据工程

会议室:二层 203AB
出品人:蒋佳涛

随着各行各业运营模式的升级,数据对于商业决策的关键作用已经达成业界共识,数据中心... 展开 >

专题出品人:蒋佳涛

京东 供应链研发部技术负责人

曾任京东零售平台主架构师,负责订单交易和履约流程的架构设计工作。目前任职于京东供应链研发部,致力于智慧供应链相关系统设计研发、落地实践,推进线上、线下业务融合的无界零售战略实施。近期旨在通过数据挖掘和AI人工智能技术,在京东落地并实现智能化的选品、动态定价和促销优化系统,大幅提升业务团队商品管理能力,最大化GMV和毛利,并先后与麦肯锡团队、斯坦福大学教授深度合作,在统计学、运筹优化及仿真方面积累了丰富的经验。

地点:二层 203AB

专题:大数据智能处理 & 数据工程

随着各行各业运营模式的升级,数据对于商业决策的关键作用已经达成业界共识,数据中心已经成为企业的核心决策支持平台之一。目前,不但有大量咨询公司以数据的采集、加工、处理、挖掘、应用作为核心业务,大量传统企业也认识到运营决策数据资产对于公司不可替代的价值,从而建立了企业内部的自有数据中心。随着上述趋势的发展,企业数据中心也在逐步完成从数据的收集与处理向智能决策支持的升级。随着日益精细化的运营需要,无论是第三方数据服务机构还是企业自建数据中心,所面临的业务与技术挑战都具有一定的共性。

我们发起“数据工程& 大数据智能处理”分享主题,旨在邀请不同领域、不同业务模式下的智能数据处理领域的架构师从不同角度分享其在围绕企业数据的采集、处理、加工、挖掘、应用的数据中心解决方案方面的经验,共同探讨包括(但不限于)基础数据模型建立、数据管理、数据采集效率、数据一致性控制、数据可用性管理、数据处理流程、面向应用的数据挖掘方法等方面的洞见。

by 樊景雪

天猫技术部
技术专家

目前电商正从流量运营转向消费者运营,不同商家/品牌商对消费者运营都有不同诉求,对数据应用带来了很大挑战。传统的数据应用方式如 BI 报表、基于 cube 的交互式分析、Ad-Hoc 实时查询等,能解决部分场景,但都存在一定局限性。比如基于实时引擎的 Ad-Hoc 可以个性化查询,但不能有比较复杂的计算逻辑。再比如基于 BI 工具的交互式分析,一般是基于固定的 cube,无法让用户自由选择想要的数据。我们需要的是一种可以由用户选择哪些数据以及指定数据处理逻辑,逻辑可以是简单查询、复杂 ETL 处理(UDF、MR等)、机器学习任务等方式中的一种或多种,这个方向我们内部称之为触发式数据计算。为了快速高效满足业务需求,我们在针对消费者(也就是人群)这个领域,抽象出了一种业务语言,叫 SML(Solar Model Language),可以很方便来描述业务需求。目前 SML 已广泛应用于品牌数据银行、策略中心等阿里 SaaS 化产品,落地场景包含人群分析、人群圈选、人群画像、人群建模等,满足品牌商/商家对人群运营的个性化诉求。

演讲提纲:

  1. 什么是触发式数据计算?
  2. 人群业务语言 SML
  3. SML 在人群分析 SaaS 化场景的应用
  4. 后续规划

听众受益点:

  • 了解一种新的数据计算方向 - 触发式计算
  • 了解数据计算逻辑如何一步步抽象成业务语言
  • 了解一种新的数据架构来满足 SaaS 产品的快速迭代

by 李滔

美团点评
高级技术专家

美团外卖平台目前覆盖了上百万商家和上亿餐饮类商品。平台的用户体验、推荐搜索以及商品管控等都强依赖于一个覆盖全面、设计合理、信息精准的知识图谱的支撑。而餐饮类商品具有非标准化、非结构化等特点,给知识图谱的建设带来巨大的挑战。

本次演讲介绍我们通过文本、图像等多模态建模,打造了国内最大规模的美食垂类知识图谱,广泛应用在外卖的搜索、推荐以及商品管控等多个业务。

演讲提纲

1. 知识图谱现状介绍

2. 外卖垂直邻域知识图谱方案

  • schema设计
  • 短文本场景下的信息抽取技术方案
  • 图像处理在知识图谱构建的应用实践

3. 业务应用介绍及踩坑和爬坑经验分享

  • C端应用
  • B端应用

4. 未来展望

 听众受益点:

  • 如何从0打造垂直领域知识图谱;
  • 如何利用文本、图像等多领域技术完成知识图谱中的信息抽取。

by 马恩驰

阿里人工智能实验室
认知实验室算法专家

在用户消费升级的大背景下,文化娱乐已经成为人们生活中非常重要的一部分。视频作为文化娱乐的重要载体,如何做好用户和视频内容的高效连接,对于增加用户黏性,提升用户留存至关重要。搜索作为视频内容分发的核心场景入口,如何在搜索意图表达有限和视频结构化信息缺乏的情况下,实现搜索意图场景下的用户与内容的了解面临极大的挑战。

传统的匹配特征在搜索相关性中表达有限,基于深度语义的表达不仅能涵盖传统的匹配场景,更能从语义层面发掘用户搜索词的潜在表达,为用户提供更极致的体验。在视频网站同质化竞争的大背景下,个性化排序作为搜索核心的分发场景,如何在不同意图场景下,对用户兴趣进行有效的表达,对于提升用户观看时长和用户体验至关重要。

演讲提纲:

  1. 深度语义和个性化排序面临的挑战
  2. 不同意图场景的深度语义相关性实践
  3. 搜索场景下用户兴趣的有效表达
  4. 视频个性化搜索排序实践
  5. TensorFlow在视频搜索中的使用

听众受益点:

  • 了解内容分发场景下深度语义相关性和个性化表征学习排序应用
  • 了解用户、搜索意图、视频内容的有效表征以及不同场景下的模型调参经验
  • 了解TensorFlow在搜索各场景下的应用

by 黄玮南

京东
数据与决策算法专家

随着电商规模的日益扩大,其销售商品的种类和数量相比传统零售商都有了质的飞越。适用于传统线下零售商的运营分析、价格策略制定方法,已经不再适用于变幻莫测的的线上市场。随之产生的电商对日常精细化运营的需求也不断增强。如何建立高效、灵活、稳定的收益管理决策系统,成为电商所面临的巨大挑战

本次演讲将以电商收益管理系统为例,介绍利用电商数据构建起决策体系方面的思考与实践。

演讲提纲:

  • 大数据驱动的智能决策:以电商收益管理问题为例
  • 构建有效的智能决策系统:关键问题与主要应对策略
  • 案例:智能清仓系统的建设实践

听众受益点:

  • 以电商收益管理决策为例,了解搭建智能决策系统的要素。
  • 了解收益管理决策在电商中的实际应用场景和落地案例;