智源论坛报名 | 智能信息检索与挖掘报告会（9月17日）

活动详情

“智能信息检索与挖掘”重大研究方向,是智源研究院继“人工智能数理基础”和“机器学习”后发布的第三个科研方向，旨在于智能信息检索与挖掘的基础理论方面寻求突破，同时基于理论基础,建立新型信息检索与挖掘算法，有效解决用户精准多样的信息需求与庞大互联网数据规模之间的鸿沟问题。

该方向首席科学家由中国人民大学信息学院院长文继荣教授担任，智源研究项目经理由中国人民大学窦志成教授担任，6位智源研究员和4位智源青年科学家来自北大、清华、人大、中科院等单位，均是所在研究领域具有国际影响力的中青年学术带头人，其中多位是国际顶级期刊的编委，曾获得国际知识发现与数据挖掘大会（KDD）、国际信息检索大会（SIGIR）等数据挖掘领域国际顶级会议的最佳论文奖，他们将着力在信息检索基础、新一代算法和系统等方面取得突破性成果。

活动报名请点击“阅读原文”。

时间地点

时间：2019年9月17日 9:30~17:00
地点：海淀区·中国人民大学文化大厦三层多功能厅

智源论坛报名 | 智能信息检索与挖掘报告会（9月17日）

活动日程

时间	主题
09:30 - 09:40	活动介绍及致辞
09:40 - 10:10	相关性认知建模探索郭嘉丰中科院计算所研究员
10:10 - 10:40	网络表示学习沈华伟中科院计算所研究员
10:40 - 11:00	休息
11:00 - 11:30	强化排序学习徐君中国人民大学教授
11:30 - 12:00	社交媒体情感计算贾珈清华大学长聘副教授
12:00 - 14:00	午餐（免费提供）
14:00 - 14:30	分布式机器学习算法的系统优化崔斌北京大学教授
14:30 - 15:00	一种基于概念规则集的可解释性学习框架王建勇清华大学教授
15:00 - 15:20	茶歇
15:20 - 15:50	面向知识图谱的自然语言问答研究邹磊北京大学教授
15:50 - 16:20	基于端到端模型的知识获取与知识问答刘康中科院自动化所副研究员
16:20 - 16:50	图神经网络 (GNN) 算法及其应用唐杰清华大学教授

议题及报告人简介

报告题目：相关性认知建模探索

报告摘要：相关性是信息检索领域的核心概念，计算机科学领域和信息科学领域都对其展开了长期研究，计算机科学领域侧重于相关性的建模，而信息科学领域则侧重于对相关性认知过程的探索，随着机器学习技术的发展，特别是深度学习技术的到来，深度检索模型具备了强大的模型容量和拟合能力，使得我们有可能利用深度检索模型建模更加复杂的相关性决策过程，提升相关性建模的有效性。在这个报告中，我将介绍一下我们从认知视角来理解相关性并对其进行建模的一些探索和研究成果。

郭嘉丰：中科院计算所研究员、博士生导师，中国科学院大学岗位教授，中科院网络数据科学与技术重点实验室副主任。

报告题目：网络表示学习

报告摘要：网络是一种常见数据类型，例如社交网络、信息网络等。网络数据固有的复杂关联、多尺度并存、高维时变等特性给网络数据的分析处理提出了挑战。网络表示学习致力于将高维稀疏的网络数据映射到低维稠密空间，从而便于利用成熟的机器学习工具完成网络数据的分析挖掘任务。报告将介绍图表示学习近年来的主要进展，包括无监督的网络嵌入和有监督的图神经网络等。最后，介绍报告人近期在网络表示学习和图卷积神经网络方面的一些研究工作。

沈华伟：中国科学院计算技术研究所研究员，博士生导师，中国科学院大学岗位教授。中国科学院青年创新促进会优秀会员项目负责人，中国科学院院长特别奖获得者。

报告题目：强化排序学习

报告摘要：在搜索系统的各个组成部分中，排序模型决定了搜索系统向用户所展示的网页顺序，对搜索性能起着至关重要的作用。近年来，得益于其强大的交互式建模能力，强化学习技术被逐步应用于搜索排序中并取得了良好的效果，被称为“强化排序学习”。本报告将介绍强化排序学习在搜索中的研究进展，包括用户与搜索系统的交互模式分析和基于马尔科夫决策过程的多样化排序任务建模与求解。实验结果表明强化排序学习能够通过多轮交互获得更优的网页排序策略。

徐君：中国人民大学教授、博导。在重要国际学术会议和期刊上发表论文50余篇，撰写英文专著1本，美国专利授权8项，论文被引用3200余次（H-index=26）。研究成果收录于多本国际知名信息检索教科书和计算机手册，在斯坦福大学、慕尼黑大学等高校课程中讲授。

报告题目：社交媒体情感计算

报告摘要：针对如何从社交媒体异构数据中获取用户情感，以及如何把情感与心理健康分析相关联等技术挑战，本报告将系统介绍报告人在网络海量数据的情感计算与交互方面开展的研究工作，重点介绍情感维度属性与情感认知表征的关联方法、融合深度学习与因子图的海量跨模态异构数据的情感预测模型、以及面向心理健康的情感计算方法等。此外，报告还将展示基于网络海量数据情感计算的其他相关应用研究，例如如何让计算机学会欣赏人类眼中的美学。

贾珈：国际情感计算领域优秀青年学者，在情感计算与情感交互领域取得突出成果，曾获得国际计算机学会（ACM）多媒体专委会（SIGMM）的“新兴领导者”奖、教育部科技进步二等奖。

报告题目：分布式机器学习算法的系统优化

报告摘要：分布式机器学习算法已经被广泛用于大规模数据分析与挖掘。在分布式机器学习系统中，我们需要考虑一些对系统性能有重要影响的因素，如并行策略、同步协议和网络通信等。报告将介绍我们在分布式机器学习系统设计优化的一些工作，包括面向高维海量数据的并行策略、面向异构环境的同步协议、基于数据草图的梯度压缩方法。报告最后也将介绍北京大学与腾讯合作研发的分布式机器学习系统Angel，系统针对海量训练数据和高维的模型参数做了深度优化，在易用性、稳定性、可扩展性等方面获得了良好的效果，并支持多种不同类型的机器学习算法。Angel系统作为腾讯第三代高性能机器学习计算平台，已经在腾讯的多个实际业务中得到了应用，并在GitHub开源 (https://github.com/Tencent/angel)。

崔斌：北京大学计算机系。主要研究领域为数据库系统设计和性能优化、数据挖掘、大数据管理与分析、分布式机器学习等方向。

报告题目：一种基于概念规则集的可解释性学习框架

报告摘要：可解释性机器学习在用户权利保障、提高用户对模型的信任度等方面扮演了越来越重要的角色，在很多关键领域（如医疗、保险、刑侦等）正变得不可或缺。现有很多关于可解释性机器学习的研究试图获取具有简单形式的模型。然而，简单的模型并不总是意味着好的可解释性。相比于通过数据拟合来进行机器学习，人类善于通过对数据归纳总结形成易于理解的概念层次。受人类学习的启发，我们尝试建立一个基于分层概念规则集的可解释性学习框架。位于某一层次的规则集对应于相应粒度的某个概念，我们使用这些不同粒度的概念来获得数据的一个可解释性表示。进而提出了一个面向分类任务的、挖掘高质量概念规则集的框架。实验结果表明该学习框架可以获得和其他可解释性学习算法相近的分类性能，同时提供了更好的可解释性。

王建勇：IEEE会士，中国人工智能学会首批会士，曾担任多个国际国内顶级期刊的编委，多个国际国内权威会议的程序委员会主席，是国内数据挖掘与互联网数据管理领域的学术带头人。

报告题目：面向知识图谱的自然语言问答研究

报告摘要：自然语言问答（QA）是指利用各种技术和数据对用户提出的自然语言问题直接给出问题答案。QA任务根据所依赖的数据形态可以分成三类，分别是基于知识库的问答（KB-QA）、基于文档的问答（DB-QA）和社区问答（C-QA）。本次报告主要关注面向知识图谱的问答系统。知识图谱是目前知识库的一种常见的表达形式，是以图形（Graph）的方式来展现“实体”、实体“属性”，以及实体之间的“关系”。近年来随着大数据，人工智能等概念与技术的兴起，知识图谱和KB-QA相关的研究工作和工业应用逐渐引起重视。例如由Amazon收购的EVI系统（原名为TrueKnowledge），就是一种面向开放领域的结构化知识的问答系统。Facebook定义的Facebook Social Graph，用于连接社交网络的用户，用户分享的照片，电影，评论；在所构建的Social Graph基础上，Facebook推出了Graph Search（图搜索）功能，即将用户的自然语言问题，转化为面向Social Graph上的图搜索问题，从而回答用户的自然语言问题。另外越来越多的chatbot（聊天机器人）产品中也引入了面向知识图谱的问答功能，使得chatbot和人交互时用户可以获得更多知识方面的回答。IBM的Watson系统在参加智力问答节目《危险边缘》（Jeopardy）的比赛时，也同样采用DBpedia和Yago知识图谱数据来回答某些自然语言问题。本次报告主要介绍目前学术界和工业界面向知识图谱问答的主要关键技术和我们组在面向知识图谱的自然语言问答系统方面的工作gAnswer。

邹磊：基于图数据库的知识图谱数据管理方法与系统研究的开拓者之一，数据挖掘领域国际顶级期刊《知识与数据工程汇刊》（IEEE TKDE）的编委，国家优青项目获得者，教育部自然科学二等奖获得者。

报告题目：基于端到端模型的知识获取与知识问答

报告摘要：知识图谱是人工智能的核心基础设施之一，对于语义内容理解有重要的支撑作用。传统知识抽取与问答方法多采用多步Pipeline的处理策略，往往存在错误积累，难以学习的问题。本报告结合研究组近些年的工作，主要介绍基于端到端的知识获取与知识问答的最新方法。其优势在于，利用神经计算与符号表示各自的优势，将大规模知识获取与问答问题转变成一个可学习问题，更加适用于大规模、开放域环境。

刘康：在知识图谱领域取得了突出成果，是2014年国际计算语言学会议（COLING）最佳论文获得者，国家优秀青年基金项目获得者。

报告题目：图神经网络 (GNN) 算法及其应用

报告摘要：图神经网络将深度学习方法延伸到非欧几里得的图数据上，大大提高了图数据应用的精度。报告将简单回顾图卷积网络（GCN）并探讨如何提高GCN在图数据上的表示学习能力。研究发现，几个巧妙、简单的方法可以有效提高GCN的表示能力，该方法可以等价表示为图注意力网络（GAT）。该方法的有效性在包括阿里巴巴等多个超大规模数据集上得到验证。

唐杰：清华大学计算机系副系主任，长聘教授，知识智能联合研究中心主任，国家杰青。发表论文200余篇、获得授权专利14项；论文谷歌学术引用12000余次；8篇论文获奖；其中在数据挖掘顶级国际会议KDD上发表论文29篇（亚洲排名第一）。

温馨提示

本次活动免费，欢迎大家带自己的同事和朋友一起参加；
请确认手机号码无误，我们会在活动开始前一天发送短信提醒；
为倡导绿色出行，我们建议您乘坐公共交通工具前往。

关于主办方

北京智源人工智能研究院（Beijing Academy of Artificial Intelligence，BAAI）是落实“北京智源行动计划”的重要举措，在科技部和北京市委市政府的指导和支持下，由北京市科委和海淀区政府推动，依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。

智源论坛报名 | 智能信息检索与挖掘报告会（9月17日）

添加智源小助手微信，发送“0917”，加入现场微信群