人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型... 展开 >
Research Director/Chief Scientist at NetEase Youdao. Responsible for developing strategic technical and research plans for the whole company, supervising and mentoring other researchers, leading technical innovations. Directly supervise our computational advertising and machine learning teams. Lead the development of key projects including Large-Scale CTR Prediction, Behavior Targeting, and Neural Machine Translation etc.
参考译文:
本科与硕士毕业于北京航空航天大学,于2007年获UC Berkeley计算机科学专业博士学位,研究方向包括大规模分布式计算,数据挖掘,机器学习,密码学以及安全和隐私。在博士期间加入有道,参与完成有道底层架构,目前任网易有道首席科学家,负责有道技术创新与相关实践工作。主要关注以深度学习为代表的最新AI技术在互联网各个领域的应用,包括机器翻译,图像识别等。主导了有道神经网络机器翻译YNMT等核心技术的研究和开发。
在国际顶级学术会议和期刊发表二十余篇学术论文,担任若干国际一流学术期刊审稿人。
人工智能如今在各个领域全面开花,例如在电商、金融、交通等领域。本专题重点讨论大型企业之人工智能平台背后的核心系统架构和核心技术,例如模型、算法和数据训练等,以及实践人工智能应用需要哪些新思维。
Personalized Learning Resource Recommendation in Real-practice
With the advent of portable devices such as tablets and e-readers (amazon kindle, ipad, Google Chromebook, etc.), reading online content for educational, learning, training or recreational purposes has become a very popular activity. Compared to printed material, readers of digital content are offered several levels of interactivity. For example, digital content allows more interactive and collaborative learning, users may read additional or supplementary online content related to a specific part of the e-text that they have difficulty understanding or wish to explore more; they can add annotations; zoom-in on a picture, or play a video embedded in the content. Despite these advantages, printed media still provides other benefits that cannot be matched by digital. Some of the advantages of printed material include: 10-30% faster reading rate, lack of distractions, no device compatibility or Internet connection issues, cost effectiveness and, most importantly, the fact that print is still the medium preferred by the majority of students. Instead of eliminating these benefits, we believe that learning should be based on print and enhanced by the use of technology rather than replaced by it.
This presentation focuses on introducing a learning system, namely METIS, which leverages the benefits of reading of both printed and digital content and provide further enhancements to the reading experiences. The system architecture, along with machine learning services and algorithms will be discussed and introduced as well. The developed system has been deployed and piloted in Silicon Valley local schools and universities with thousands of participants in real class.
Outline:
参考译文:
随着各种便携式设备如平板电脑、Kindle、Chromebook的广泛使用,在线教育、培训和娱乐等内容越来越流行。和传统的纸质材料相比,电子读物更具互动性,可以在线传播,学习更多的在线相关内容,遇到理解障碍可以在线查询,拓展知识视野,还可以阅读过程中添加注释,缩放,或者播放阅读内容里的嵌入视频多媒体资源。
然而,纸质读物也有自身优势,例如阅读速度更快,不会分心,不需要考虑和电子设备的兼容,成本低,最重要的是,绝大多数学生需要纸质读物。排除这些优势,我们相信在电子技术的辅助下,纸质读物仍然是学习的主体,而且也不该被电子设备完全替代。
本演讲将重点介绍METIS学习系统,该系统将电子和纸质读物内容的优势结合起来,为未来的高效阅读体验提供混合式的增强手段。我会在演讲中介绍并分析该系统中的机器学习和算法技术架构,这套系统已经在硅谷当地的中学和大学获得广泛应用。
演讲提纲:
1. 混合学习的背景
2. 混合学习系统
3. 机器学习技术
4. 系统挑战
5. 系统部署和讨论
滴滴已成为日成交订单千万量级的全球最大出行平台,作为中台三个最核心引擎之一的地图引擎是整个平台的基石,重度参与了线上业务流程的几乎每一个环节。业务要求赋予了滴滴地图超出传统地图之外的新使命:除确保导航、底图展示等功能体验外,还需要通过与接驾、派单、预估价等业务场景结合并精细打磨带来平台整体效率的提升。
本次分享将会阐述在滴滴当下的业务场景中地图的核心价值,同时重点介绍在服务迭代过程中面对的全新技术挑战(业务高性能要求与严苛的效果约束,经典地图算法与AI的结合等),以及在挑战下滴滴地图团队做出的努力和取得的成果。希望通过本次分享,能够让大家对出行场景中的地图服务有一个系统认识,并提供一些技术领域交叉的思路。
Machine Learning in Security and Integrity:With the emerging of e-market (e.g. Taobao, Amazon), cloud (e.g. Baidu Yun, AWS, Azure), and social network (e.g. WeChat, Facebook), the world becomes smaller and smaller with unbelievable easily running business, accessing large-scale resources and services, building community and sharing your moments cross continents within seconds. However, the concerns on security and integrity are arising too. Facing daily big data (petabyte or even more) with both imbalance and ambiguity, the real-time machine learning solution becomes challenging but demanding, which stimulates many breakthroughs.
This presentation starts with a quick overview of security problems, then it will discuss the machine learning platform, and focus on the topics related to the advanced technologies and solutions for the challenges facing in our time and the lessons from real applications. The presentation will end with the specific examples of recent machine learning applications in security.
With the talker’s numerous years of experience in the high-profile companies and dealing with the real-time solution for large world-wide data, the audience will learn from his experience (both success and lessons from failure) and perspective.
Audience will learn:
参考翻译:
随着电子商务如Taobao, Amazon的崛起,云计算如AliCloud, AWS, Azure的爆发,以及社交网络如WeChat, Facebook的大面积普及化,使得商业业务创新和开展越来越容易,轻而易举使用大规模资源和服务,全球化信息互动和共享已经可以同步,总的来说世界正在变得越来越小。但是,信息安全和商业诚信问题却不断增加,面对每天超过PB级的不平衡和模糊大数据,实时机器学习和解决方案面临着巨大的挑战。这样的要求在各个领域越来越多,促发了许多突破性的研究成果和应用。
演讲过程中会快速浏览一些安全问题,然后讲述一下机器学习平台,重点讲解能够处理当下棘手问题的相关先进技术和解决方案,以及一些真实的应用效果。最后会分享几个最近机器学习在安全应用上的特别案例。
讲师希望分享他十余年在IT界高端的几个公司里的宝贵经验。这些经验来自于对实时海量数据的机器学习及解决方案,成功和经验。
新浪微博,中国最大的社交媒体平台,每天上亿条内容产生并在万亿级关系的社交网络上进行传播。
热门微博,用户基于兴趣阅读微博内容的信息流产品,大幅降低用户使用微博的阅读成本,并有效提高用户在线时长。热门微博根据产品定位,将前沿机器学习技术应用到个性化信息流推荐系统中,结合强大的后台服务保障体系,为微博用户提高良好的阅读体验。
本次演讲将主要围绕主流前沿机器学习技术在热门微博中的应用成果,并探讨如何打造适合自己产品的推荐系统。
演讲提纲:
听众受益:
神经网络机器翻译(NMT)技术综述
NMT技术实践
NMT技术在教育领域的应用
UNIT为广大开发者提供了可定制的对话系统解决方案,经过近1年的技术升级,UNIT2.0即将与大家正式见面。本次,我们将为大家带来UNIT的整体架构、UNIT2.0的新特性及其核心技术,以及我们全新开放的对话流框架。同时我们还将为听众详细演示如何使用我们的UNIT服务快速搭建一个完整的对话系统。
演讲提纲:
1. 百度UNIT:对话系统定制平台的整体架构剖析
2. UNIT2.0 新特性及其核心技术
3. 全新的对话流框架
4. 如何使用UNIT服务快速搭建一个完整的对话系统
听众受益点:
1. 可了解百度在对话系统方面最前沿的技术
2. 可了解如何使用百度提供的技术,快速为自己的产品装上能听清听懂用户需求的智能对话能力
Blued为垂直人群提供简便快捷的社交服务,全球4000万帅哥通过Blued发布头像相册、图片动态、小视频等。如何在海量的社交网络数据中为用户快速发现身边的好友,根据用户的兴趣爱好进行匹配,加入不同的兴趣群组与大家互动,是极具挑战的工作。视觉信息在社交产品中尤为重要,在Blued的图像社交产品图Fun上,用户方便浏览兴趣标签下的高颜值照片,用小视频快速了解真实的对方,每个环节都深度使用了AI图像技术。
本次演讲将介绍Blued如何在业务架构中应用AI图像算法,为社交推荐算法提供更丰富的视觉特征信息,分享我们对于社交网络中图像内容的处理心得。
1.图像社交业务简介
2.图像神经网络技术方案介绍
3.未来的规划与探索