今天为大家推荐的是SIGIR 2016大会上,来自微软研究院自然语言处理方向的两位研究员——Scott Wen-tau Yih和Hao Ma的分享。
研讨会的主题是“基于但不限于知识库、万维网的问答系统”(Question Answering with Knowledge Base, Web and Beyond)。
研讨会从搜索引擎的发展历程出发,以微软搜索引擎——Bing为例,从最初基于文字搜索的问答系统,发展到了以Cortana为代表的基于对话的问答系统。
而这背后基于的原理都是如何让机器去更好的理解自然语言,比如可以用自然语言和用户交流的通用语言处理器,有效可以处理陈述句式或问句等。
现代问答系统中常见的问题分类主要有——
· 事实类问题:
基于实体客观事实的信息查询;
竞技类信息
· 描述性问题:
观点类或指导性查询(例如“如何做”的问题)
· 多模式问题
基于视觉的问答
旅行助手
· 人工智能的能力测试
阅读理解
小学水平的科学或数学知识测试等
目前,在技术层面,搜索问答系统主要有以下几个方面的挑战——
· 问题分析:包括回答类型、格子填充、语义分析等
· 文本/数据分析
· 意译&匹配:包括如何处理问题的差异性、本体匹配等
· 搜索复杂度
基于上述这些问题,研讨会的内容主要分为以下几个部分:
· 基于知识库的问答系统
现代大规模知识库的介绍
数据集和最先进的方法论
· 基于万维网的问答系统
问题的设定与一般系统架构
关键语言分析
其他信息源的利用
· 测试机器智能的问答系统
阅读理解
推理测试
本文来源于"中国人工智能学会",原文发表时间"2016-07-14"