解锁深度视频理解的潜力

所属专题:人工智能与业务应用

嘉宾 : 曾文军, Ph.D., IEEE | Microsoft Research AsiaPrincipal Research Manager

会议室 : 第二会议厅C

讲师介绍

专题演讲嘉宾:曾文军, Ph.D., IEEE

Microsoft Research Asia Principal Research Manager

曾文军,微软亚洲研究院高级领导团队(SLT)成员,首席主任研究员,国际电气电子工程师学会院士(IEEE Fellow),西安交大-微软亚研院智能信息处理联合实验室主任,密苏里大学,中国科技大学,西安交大,天津大学等多所学校博士导师。

1990年毕业于清华大学电子工程系,1993年和1997年分别获美国圣母大学和普林斯顿大学电气工程硕士和博士学位。先后在美国松下信息技术实验室,贝尔实验室,夏普实验室,PacketVideo 等公司工作。2003-2016任密苏里大学计算机科学系终身教授。2014年加盟微软亚洲研究院。他对国际标准(ISO MPEG、JPEG2000 和 Open Mobile Alliance)发展作出重大贡献,发表了大量论文和专利并被广泛引用,并有两部关于多媒体安全和社交多媒体的著作。

Kevin目前负责微软亚洲研究院视频分析和理解的研发,为微软认知服务和 Azure 媒体分析服务提供技术。同时担任 IEEE Multimedia Magazine 副总编(Associate Editor-in-Chief),并担任过多个 IEEE 国际期刊副主编及期刊或会议的督导委员会主席或成员,客座编辑了多个 IEEE 特刊, 并担任多个 IEEE 会议大会共同主席或技术程序委员会主席。

议题介绍

演讲:解锁深度视频理解的潜力

Abstract:

Human’s perception, learning, cognition, and activities are mostly mediated through vision. Deep learning has fundamentally changed the landscape of image/video understanding in recent years, thanks to the advances of big data, big computing, and innovations in deep architectures and learning methods. In this talk, I will discuss the key ideas and major advances in deep learning technologies in the quest for visual intelligences. I will shed some light on the go-to-market aspect of this exciting field, based on some use cases. I will also discuss open issues.

解锁深度视频理解的潜力

人工智能离不开感知,而视觉是我们最主要的感知手段。深度学习近年来颠覆了图像/视频理解的进程。这要归因于大数据,大计算,和深度学习体系结构和方法的巨大进步和创新。这次演讲将讨论在视觉智能发展中深度学习技术的关键理念和主要进展,并基于一些实际用例简单阐明如何在这个令人兴奋的领域中开拓市场,实现技术落地。本次演讲也将讨论一些未来技术趋势。

提纲:

  1. 视觉智能和深度学习简介;
  2. 深度图像理解技术;
  3. 深度视频理解技术;
  4. 实际应用及市场化;
  5. 未来技术趋势探讨。

听众受益点:

  1. 了解视觉计算核心问题和相关的深度学习技术方案;
  2. 了解深度视频理解的应用场景和技术瓶颈;
  3. 了解业界技术状态和趋势。

极客邦控股(北京)有限公司

北京市朝阳区望京利泽中二路洛娃大厦C座6层1607