人工智能业务架构

会议室:大宴会厅2
出品人:段亦涛

人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型... 展开 >

专题出品人:段亦涛

网易有道 首席科学家

Research Director/Chief Scientist at NetEase Youdao. Responsible for developing strategic technical and research plans for the whole company, supervising and mentoring other researchers, leading technical innovations. Directly supervise our computational advertising and machine learning teams. Lead the development of key projects including Large-Scale CTR Prediction, Behavior Targeting, and Neural Machine Translation etc.

参考译文:

本科与硕士毕业于北京航空航天大学,于2007年获UC Berkeley计算机科学专业博士学位,研究方向包括大规模分布式计算,数据挖掘,机器学习,密码学以及安全和隐私。在博士期间加入有道,参与完成有道底层架构,目前任网易有道首席科学家,负责有道技术创新与相关实践工作。主要关注以深度学习为代表的最新AI技术在互联网各个领域的应用,包括机器翻译,图像识别等。主导了有道神经网络机器翻译YNMT等核心技术的研究和开发。

在国际顶级学术会议和期刊发表二十余篇学术论文,担任若干国际一流学术期刊审稿人。

地点:大宴会厅2

专题:人工智能业务架构

人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型企业之人工智能平台背后的核心系统架构和核心技术,例如模型、算法和数据训练等,以及实践人工智能应用需要哪些新思维。

by 刘磊

机器学习专家

Personalized Learning Resource Recommendation in Real-practice

With the advent of portable devices such as tablets and e-readers (amazon kindle, ipad, Google Chromebook, etc.), reading online content for educational, learning, training or recreational purposes has become a very popular activity. Compared to printed material, readers of digital content are offered several levels of interactivity. For example, digital content allows more interactive and collaborative learning, users may read additional or supplementary online content related to a specific part of the e-text that they have difficulty understanding or wish to explore more; they can add annotations; zoom-in on a picture, or play a video embedded in the content. Despite these advantages, printed media still provides other benefits that cannot be matched by digital. Some of the advantages of printed material include: 10-30% faster reading rate, lack of distractions, no device compatibility or Internet connection issues, cost effectiveness and, most importantly, the fact that print is still the medium preferred by the majority of students. Instead of eliminating these benefits, we believe that learning should be based on print and enhanced by the use of technology rather than replaced by it.

This presentation focuses on introducing a learning system, namely METIS, which leverages the benefits of reading of both printed and digital content and provide further enhancements to the reading experiences. The system architecture, along with machine learning services and algorithms will be discussed and introduced as well. The developed system has been deployed and piloted in Silicon Valley local schools and universities with thousands of participants in real class.

Outline:

  1. Background of Hybrid Learning
    1. Digital v.s. Physical Content
    2. Hybrid Content
  2. Hybrid Learning System
    1. System Architecture
    2. Content Creator View & Functions
    3. Reader’s View & Functions
  3. Machine Learning Technologies
    1. User profiling
    2. Personalized Content Recommendation
    3. Learning Graph Generation
    4. Illustration Image Recommendation
    5. EEG signal for attention detection
  4. Challenges
    1. Data sparsity
    2. “Too long to process” issue
    3. Semantic topic discovery and representation
  5. System deployment and Discussion
    1. Performance evaluation in real system
    2. Feedbacks

参考译文:

随着各种便携式设备如平板电脑、Kindle、Chromebook的广泛使用,在线教育、培训和娱乐等内容越来越流行。和传统的纸质材料相比,电子读物更具互动性,可以在线传播,学习更多的在线相关内容,遇到理解障碍可以在线查询,拓展知识视野,还可以阅读过程中添加注释,缩放,或者播放阅读内容里的嵌入视频多媒体资源。

然而,纸质读物也有自身优势,例如阅读速度更快,不会分心,不需要考虑和电子设备的兼容,成本低,最重要的是,绝大多数学生需要纸质读物。排除这些优势,我们相信在电子技术的辅助下,纸质读物仍然是学习的主体,而且也不该被电子设备完全替代。

本演讲将重点介绍METIS学习系统,该系统将电子和纸质读物内容的优势结合起来,为未来的高效阅读体验提供混合式的增强手段。我会在演讲中介绍并分析该系统中的机器学习和算法技术架构,这套系统已经在硅谷当地的中学和大学获得广泛应用。

演讲提纲:

1. 混合学习的背景

  • 电子和纸质阅读资源对比
  • 混合阅读资源

2. 混合学习系统

  • 系统架构
  • 内容创建者-系统功能
  • 读者-系统功能

3. 机器学习技术

  • 用户建模
  • 个性化内容推荐
  • 学习路径自动规划
  • 图像推荐实例
  • 机遇脑电波信号的注意力检测系统

4. 系统挑战

  • 数据稀疏性
  • 查询太长不能处理问题
  • 语义主题发现和表征

5. 系统部署和讨论

  • 系统性能评估
  • 客户效果反馈

by 朱智青

滴滴出行
地图事业部高级专家

滴滴已成为日成交订单千万量级的全球最大出行平台,作为中台三个最核心引擎之一的地图引擎是整个平台的基石,重度参与了线上业务流程的几乎每一个环节。业务要求赋予了滴滴地图超出传统地图之外的新使命:除确保导航、底图展示等功能体验外,还需要通过与接驾、派单、预估价等业务场景结合并精细打磨带来平台整体效率的提升。

本次分享将会阐述在滴滴当下的业务场景中地图的核心价值,同时重点介绍在服务迭代过程中面对的全新技术挑战(业务高性能要求与严苛的效果约束,经典地图算法与AI的结合等),以及在挑战下滴滴地图团队做出的努力和取得的成果。希望通过本次分享,能够让大家对出行场景中的地图服务有一个系统认识,并提供一些技术领域交叉的思路。

演讲大纲

  • 地图概述
  • 出行平台中的地图
  • 结合业务场景的几个重要优化
  • 高性能场景中的数据快速更新
  1. 全量+局部更新体系
  2. 海量离线数据的回溯
  3. 线上效果的监控与验证
  • 经典地图问题的重新建模
  1. ETA技术的演变
  2. 路径规划架构的迭代
  3. 道路匹配问题的优化
  • 未来规划

by 徐斌

Facebook
Software Engineer Manager

Machine Learning in Security and Integrity:With the emerging of e-market (e.g. Taobao, Amazon), cloud (e.g. Baidu Yun, AWS, Azure), and social network (e.g. WeChat, Facebook), the world becomes smaller and smaller with unbelievable easily running business, accessing large-scale resources and services, building community and sharing your moments cross continents within seconds. However, the concerns on security and integrity are arising too. Facing daily big data (petabyte or even more) with both imbalance and ambiguity, the real-time machine learning solution becomes challenging but demanding, which stimulates many breakthroughs.

This presentation starts with a quick overview of security problems, then it will discuss the machine learning platform, and focus on the topics related to the advanced technologies and solutions for the challenges facing in our time and the lessons from real applications. The presentation will end with the specific examples of recent machine learning applications in security.

演讲提纲

  1. Overview of some security problems at the emerging e-market, cloud and social network 
    a. Transaction fraud and abuse 
    b. Cloud security 
    c. Integrity
  2. Machine learning platform and structure 
    a. Offline build, online deployment, feedback loop 
    b. Data and feature engineering 
    c. Horizontal v.s. Vertical model structure  
    d. Traditional classification v.s. deep learning. 
  3. Challenges and lessons learnt 
    a. Imbalanced data 
    b. Dealing with ambiguity: semi-label and no-label 
    c. Cold start problem
  4. Application #1: Machine Learning in transaction risk management
  5. Application #2: Machine Learning in cloud security

听众受益

With the talker’s numerous years of experience in the high-profile companies and dealing with the real-time solution for large world-wide data, the audience will learn from his experience (both success and lessons from failure) and perspective.

Audience will learn:

  1. An overview of machine learning platform and structure, especially in security solution.
  2. Through the two applications, audience will gain a valuable perspective from how advanced technology dealing with large scale data are used in the real-time system.

参考翻译:

随着电子商务如Taobao, Amazon的崛起,云计算如AliCloud, AWS, Azure的爆发,以及社交网络如WeChat, Facebook的大面积普及化,使得商业业务创新和开展越来越容易,轻而易举使用大规模资源和服务,全球化信息互动和共享已经可以同步,总的来说世界正在变得越来越小。但是,信息安全和商业诚信问题却不断增加,面对每天超过PB级的不平衡和模糊大数据,实时机器学习和解决方案面临着巨大的挑战。这样的要求在各个领域越来越多,促发了许多突破性的研究成果和应用。

演讲过程中会快速浏览一些安全问题,然后讲述一下机器学习平台,重点讲解能够处理当下棘手问题的相关先进技术和解决方案,以及一些真实的应用效果。最后会分享几个最近机器学习在安全应用上的特别案例。

演讲提纲

  1. 总览几个电商、云计算和社交网络出现的安全问题 
    a. 交易欺诈和滥用 
    b. 云计算安全 
    c. 广告及其他商业诚信
  2. 机器学习平台和架构 
    a. 离线构建,在线部署,反馈机制 
    b. 数据和特征工程 
    c. 平行 v.s 垂直模型结构 
    d. 传统分类 v.s 深度学习
  3. 挑战和切身教训 
    a. 非平衡数据 
    b. 处理模糊性:半标签和无标签 
    c. 冷启动问题
  4. 应用 1: 机器学习在交易风险管理方面的实践
  5. 应用 2: 机器学习在云安全方面的实践

听众受益

讲师希望分享他十余年在IT界高端的几个公司里的宝贵经验。这些经验来自于对实时海量数据的机器学习及解决方案,成功和经验。

  1. 整体了解机器学习平台和构架,尤其是在安全诚信领域中。
  2. 通过分享的这两个应用,参会者能够进一步学习实时系统是如何使用先进的机器学习处理大规模数据。

by 苏传捷

新浪微博
算法平台工程师

新浪微博,中国最大的社交媒体平台,每天上亿条内容产生并在万亿级关系的社交网络上进行传播。

热门微博,用户基于兴趣阅读微博内容的信息流产品,大幅降低用户使用微博的阅读成本,并有效提高用户在线时长。热门微博根据产品定位,将前沿机器学习技术应用到个性化信息流推荐系统中,结合强大的后台服务保障体系,为微博用户提高良好的阅读体验。

本次演讲将主要围绕主流前沿机器学习技术在热门微博中的应用成果,并探讨如何打造适合自己产品的推荐系统。

演讲提纲:

  • 新浪微博及热门微博介绍;
  • 个性化推荐引擎框架: 
      基础层 
      推荐层 
      排序层
  • 特征挖掘与特征工程: 
      超短文本内容特征构建 
      超大规模关系特征提取
  • 大规模实时协同推荐;
  • 大规模多目标机器学习排序: 
      千亿级排序模型 
      多目标排序模型
  • 深度学习在推荐场景的应用;
  • 效果总结和未来技术规划。

听众受益:

  • 复杂社交网络中用户特征和短文本内容的特征挖掘方法;
  • 大规模排序模型中多目标融合的有效实施方案;
  • 大规模协同推荐与深度学习在热门微博中的应用。

by 段亦涛

网易有道
首席科学家

神经网络机器翻译(NMT)技术综述

  • 发展历程
  • 当前主流NMT技术架构,特点

NMT技术实践

  • 实践环节诸多考虑
  • 实时机器翻译服务的技术要求
  • 有道NMT实践经验分享

NMT技术在教育领域的应用

  • Grammatical Error Correction
  • Automatic Eessay Grading

by 孙珂

百度
自然语言处理部主任架构师

by 凌光

百度
NLP部门资深研发工程师

UNIT为广大开发者提供了可定制的对话系统解决方案,经过近1年的技术升级,UNIT2.0即将与大家正式见面。本次,我们将为大家带来UNIT的整体架构、UNIT2.0的新特性及其核心技术,以及我们全新开放的对话流框架。同时我们还将为听众详细演示如何使用我们的UNIT服务快速搭建一个完整的对话系统。

演讲提纲:

1. 百度UNIT:对话系统定制平台的整体架构剖析
2. UNIT2.0 新特性及其核心技术
3. 全新的对话流框架
4. 如何使用UNIT服务快速搭建一个完整的对话系统

听众受益点:

1. 可了解百度在对话系统方面最前沿的技术
2. 可了解如何使用百度提供的技术,快速为自己的产品装上能听清听懂用户需求的智能对话能力

by 周怡

Blued
算法工程师

Blued为垂直人群提供简便快捷的社交服务,全球4000万帅哥通过Blued发布头像相册、图片动态、小视频等。如何在海量的社交网络数据中为用户快速发现身边的好友,根据用户的兴趣爱好进行匹配,加入不同的兴趣群组与大家互动,是极具挑战的工作。视觉信息在社交产品中尤为重要,在Blued的图像社交产品图Fun上,用户方便浏览兴趣标签下的高颜值照片,用小视频快速了解真实的对方,每个环节都深度使用了AI图像技术。

本次演讲将介绍Blued如何在业务架构中应用AI图像算法,为社交推荐算法提供更丰富的视觉特征信息,分享我们对于社交网络中图像内容的处理心得。

演讲提纲:

1.图像社交业务简介

2.图像神经网络技术方案介绍 

  • 图像标签检测CNN
  • 人体体型分类CNN
  • 图像场景分类
CNN
  • 人脸检测和特征聚类
  • 用户兴趣标签
  • 热度打分和个性化排序

3.未来的规划与探索

  • 图像和用户特征融合的深度学习模型
  • 多个图像神经网络模型的灵活组合

听众受益点:

  • 了解社交网络中的图像社交产品落地方案
  • 了解图像深度学习技术在社交网络中的应用实例
想要批量报名或更多优惠?
立即联系票务报名小助手豆包
或致电:010-84780850