基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。
10月25日下午,2018中国计算机大会上举办了以“认知图谱与推理”为主题的技术论坛,领域专家与参会者们一起探讨了如何构建超大规模的认知图谱,及其在工业界实际场景中的应用,并深入探讨了数据智能、机器学习、图计算、认知推理等多方面的结合应用的理论方法与实践经验,现场参与观众爆满。
论坛上,来自阿里巴巴达摩院智能计算实验室的数据科学家杨红霞博士和计算平台系统工程总监钱正平博士,分别从算法和系统角度,介绍了认知图谱在阿里电商推荐、视频分析、金融风控等领域的真实场景的生产实践。
专家简介
杨红霞,阿里巴巴资深算法专家/总监。她带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。加入阿里之前,杨博士曾任IBM全球研发中心Watson研究员,Yahoo!主任数据科学家。在顶级统计和机器学习国际学术期刊会议发表论文40余篇(包括JASA, ICML, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,2017浙江省千人。杨博士毕业于美国杜克大学。
钱正平,阿里巴巴资深技术专家/总监。他带领团队负责围绕阿里巴巴内外诸如图计算、机器学习等新兴应用的系统研发和商业解决方案构建。加入阿里之前,钱博士曾任微软亚洲研究院主管研究员。研究兴趣是分布式和数据并行计算,在OSDI、NSDI、EuroSys、VLDB等会议发表论文、并曾获EuroSys 2012最佳论文奖。钱博士毕业于华南理工大学。
杨红霞博士介绍,阿里巴巴生态体系有着极其丰富多样的数据,涵盖着从购物、出行,到娱乐、支付等各个方面。作为信息过滤的重要手段和电商应用的核心服务,个性化推荐系统需要依赖这一数据,识别我们的习惯和爱好来推荐合适的商品或者服务。但是传统的推荐系统容易出现稀疏性、冷启动和信息重复性的问题,而认知图谱作为大规模图表征的一类重要模型正在成为一种新兴类型的推荐辅助信息,可以将自然人的全域信息有效的结合起来,真正挖掘、理解每个人的需求,在每个业务域推出消费者真正感兴趣的潜在商品。
杨博士还具体以淘宝推荐算法为例,介绍了如何利用图表征学习等技术,融合异构信息,对于超过几十亿节点、千亿边的超大规模知识图谱上进行有效的推理分析。从而利用多样化数据间的复杂关联和结构特征,为用户提供更精准和可靠的信息。这些结构特征也被用于更好的捕捉电商行为中的异常。
另一方面超大规模认知图谱的计算与推理也给系统设计带来巨大挑战。下一个报告中,钱正平博士首先介绍了阿里基于图模型的智能服务系统架构,包括图模型的维护、数据智能计算,以及与人工、算法知识的融合,并最终提供实时的在线服务。接着钱博士从底层图存储、并行计算与高层语言抽象和优化等角度,重点介绍了系统挑战和阿里的工作。
此外钱正平博士还透露,阿里正在结合过去几年在真实场景的大规模应用与实践经验,研发新一代图计算引擎MaxGraph,支撑超大规模认知图谱推理计算。相比现有图存储或图数据库,MaxGraph为图模型提供了高效的分布式存储、支持实时更新与保证数据一致性;自研的分布式数据流引擎能支持包括交互查询,批量全图计算,和低延迟、高并发在线服务在内的多模式混合执行;另外通过兼容TinkerPop Gremlin等流行的图查询语言,和提供自研的能够表达图表征学习等更丰富图计算语义的高层描述性语言及自动优化,提供良好的可编程性。MaxGraph旨在为大规模知识图谱应用提供统一的计算引擎和更高层的系统抽象,在应用与底层硬件、网络之间架起桥梁,充分发挥硬件性能、突破计算规模与性能瓶颈。
在最后的讨论环节,各位专家进一步展望了认知图谱与推理领域的发展、分享了研究挑战与机遇。钱博士强调了算法与系统工程紧密结合的重要性,更为重要的,是要和领域专家紧密协作、真正深入和解决真实场景的重要问题。相信超大规模认知图谱及计算能力,会成为更多AI应用的基础设施、并带动更多的行业创新。
点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径,限时直播课程免费报名中!欢迎戳“https://yq.aliyun.com/promotion/689”免费报名学习。