大规模异构网络数据融合

所属专题:人工智能与业务应用

嘉宾 : 张宇韬 | 清华大学科技大数据研究中心 首席研究员

会议室 : 第二会议厅C

讲师介绍

专题演讲嘉宾:张宇韬

清华大学 科技大数据研究中心 首席研究员

张宇韬,清华大学数据科学研究院科技大数据研究中心首席研究员。研究方向为异构数据融合及知识图谱构建。在KDD、CIKM、VAST等数据挖掘领域国际重要会议上发表多篇论文。作为技术负责人参与研发学术网络分析挖掘系统AMiner,集成上亿的学者、机构、科技文献、专利数据,提供针对科技数据的搜索及可视化分析功能,拥有数百万用户访问量。曾获得吴文俊人工智能科技进步一等奖,IJCAI数据竞赛第二名。

议题介绍

演讲:大规模异构网络数据融合

AMiner是全球领先的学术网络分析挖掘系统,基于来自异构数据源的上亿学者、机构、技术概念、科技文献、专利等信息构建了科技领域知识图谱,为用户提供包括专家发现、合作推荐、技术热点趋势分析等功能。为BATH等顶级科技企业及国内外科研机构提供知识智能服务。

异构数据融合是AMiner底层知识图谱构建的核心问题。这次演讲将分享我们在多源异构数据融合、实体排岐等问题上采用的机器学习模型、技术方案及实践心得。

演讲提纲

  • 异构数据融合及知识图谱构建介绍
  • 异构数据融合中的机器学习方法
  1. 异构网络数据的实体表征学习
  2. 重名实体排岐及实体链接
  3. 交互式验证及基于反馈主动学习
  • 基于科技知识图谱的智能服务

听众收益

  • 了解异构数据融合及知识图谱构建的核心问题及相关的机器学习技术方案
  • 了解科技知识图谱的应用场景

极客邦控股(北京)有限公司

北京市朝阳区望京利泽中二路洛娃大厦C座6层1607