高性能计算与业务结合

会议室:待定
出品人:郭振宇

借助高性能计算(HPC) ,基于海量数据对复杂问题进行建模、模拟和分析,可以解决... 展开 >

专题出品人:郭振宇

腾讯系统研发总经理

腾讯专家工程师,06年加入腾讯,曾担任腾讯海量数据分布式存储业务平台技术总监,为腾讯云、微信、QQ、Qzone、微云等产品提供图片、文件、结构化数据等高性能存储服务;现任系统研发总经理,负责构建腾讯高性能计算服务,打造了TencentOS、星辰GPU算力、机智高性能计算、FPGA和芯片异构计算等平台和服务,作为腾讯基础设施为海量业务赋能。10余年在技术领域深耕,具有深厚技术视野和行业洞察,以及丰富的业务、产品经验。

专题:高性能计算与业务结合

借助高性能计算(HPC) ,基于海量数据对复杂问题进行建模、模拟和分析,可以解决很多科学上和工程上最棘手的难题,在药物化合物、提前预测重大天气变化,医疗AI、游戏AI、NLP、CV等领域都有广泛应用。本专题邀请国内大型互联网公司分享高性能计算相关技术,包括芯片、操作系统、计算平台、机器学习平台及加速等领域的技术研究和应用案例,帮助AI算法工程师、科研技术人群了解业界的技术进展和使用效果。

by 兰瑞

腾讯
云架构平台部/高级工程师

腾讯内部大量的业务线对于深度学习有着强烈的需求,并且各业务线存在个性化的诉求。如何打造一个能适应业务场景、高性能的深度学习平台?

腾讯从 GPU 集群建设,到大规模的虚拟机/容器调度,最后到深度学习框架和组件的优化,提供全栈的解决方案,帮助 AI 工程师达成目标。目前支撑了腾讯内部游戏 AI、CV、信息流、NLP 等主流业务场景下的深度学习模型训练。

演讲提纲:

  1. 业务场景需求
  2. 深度学习平台整体架构
  3. 大规模 GPU 调度系统
  4. 深度学习加速
  5. 业务效果和演进方向

听众受益点:

  1. 对深度学习平台有完整全貌了解
  2. 介绍深度学习的一些前沿技术和其实际落地情况

by 江成

虎牙
基础保障部/AI平台负责人

2018年5月虎牙在美国上市,在这之前基于深度学习的推荐系统、图像CV技术已经在公司的各直播业务中得到应用,但是随着公司业务的井喷式增长,原有的小作坊式 AI 开发模式已经难以适应快速增长的 AI 应用场景,以及日益提升的系统复杂度需求,虎牙 AI 平台应运而生。针对大规模标注数据交付难的问题,虎牙 AI 平台在引入外部标注团队的同时,开发了 AI 辅助标注技术,提升标注的人均和平台交付效率。

在模型生产环节,虎牙 AI 平台提供了多种产品形态满足不同 AI 应用、不同阶段的需求,比如 Notebook 用于数据处理、模型构建,工作流平台满足模型自动化迭代的需求,大规模分布式训练平台解决模型训练时间过长的痛点。

最后,虎牙AI平台的跨平台推理加速引擎,帮助算法工程师屏蔽底层复杂的异构计算环境,实现跨平台的模型优化和一键部署。

演讲提纲:

  1. AI 技术在直播场景中的应用及面临的挑战
    • AI 应用
    • 面临挑战及基础设施侧的应对之道
  2. 虎牙 AI 平台技术架构演进
    • 私有云架构
    • 混合云架构
  3. 一站式机器学习平台建设
    • 数据标注
      • 百万级图片标注数据交付
      • 上万小时有效时长语音标注数据交付
    • 模型训练
      • 数据、建模、训练协同解决方案
      • 大规模分布式训练
    • 跨平台推理加速引擎
      • 异构推理平台,支持 CPU、GPU、NPU 等
      • 模型优化引擎
      • 一键全球模型分发、部署
  4. 规划和展望

听众受益:

  1. 机器学习端到端的工作流程
  2. 混合云架构下的 AI 基础设施建设
  3. 互动直播场景的 AI 工程实践

InfoQ助你疫后复工,提升战力!全年会议门票最低5折起,立即查看>>

想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86-15600537884