【2018中国计算机大会】阿里资深专家谈认知图谱的机遇与挑战-阿里云开发者社区

开发者社区> 云攻略小攻> 正文

【2018中国计算机大会】阿里资深专家谈认知图谱的机遇与挑战

简介: 基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。
+关注继续查看

基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。

10月25日下午,2018中国计算机大会上举办了以“认知图谱与推理”为主题的技术论坛,领域专家与参会者们一起探讨了如何构建超大规模的认知图谱,及其在工业界实际场景中的应用,并深入探讨了数据智能、机器学习、图计算、认知推理等多方面的结合应用的理论方法与实践经验,现场参与观众爆满。
image001

论坛上,来自阿里巴巴达摩院智能计算实验室的数据科学家杨红霞博士和计算平台系统工程总监钱正平博士,分别从算法和系统角度,介绍了认知图谱在阿里电商推荐、视频分析、金融风控等领域的真实场景的生产实践。
16_29_16__11_02_2018

专家简介

杨红霞,阿里巴巴资深算法专家/总监。她带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。加入阿里之前,杨博士曾任IBM全球研发中心Watson研究员,Yahoo!主任数据科学家。在顶级统计和机器学习国际学术期刊会议发表论文40余篇(包括JASA, ICML, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,2017浙江省千人。杨博士毕业于美国杜克大学。

钱正平,阿里巴巴资深技术专家/总监。他带领团队负责围绕阿里巴巴内外诸如图计算、机器学习等新兴应用的系统研发和商业解决方案构建。加入阿里之前,钱博士曾任微软亚洲研究院主管研究员。研究兴趣是分布式和数据并行计算,在OSDI、NSDI、EuroSys、VLDB等会议发表论文、并曾获EuroSys 2012最佳论文奖。钱博士毕业于华南理工大学。

杨红霞博士介绍,阿里巴巴生态体系有着极其丰富多样的数据,涵盖着从购物、出行,到娱乐、支付等各个方面。作为信息过滤的重要手段和电商应用的核心服务,个性化推荐系统需要依赖这一数据,识别我们的习惯和爱好来推荐合适的商品或者服务。但是传统的推荐系统容易出现稀疏性、冷启动和信息重复性的问题,而认知图谱作为大规模图表征的一类重要模型正在成为一种新兴类型的推荐辅助信息,可以将自然人的全域信息有效的结合起来,真正挖掘、理解每个人的需求,在每个业务域推出消费者真正感兴趣的潜在商品。
image007

杨博士还具体以淘宝推荐算法为例,介绍了如何利用图表征学习等技术,融合异构信息,对于超过几十亿节点、千亿边的超大规模知识图谱上进行有效的推理分析。从而利用多样化数据间的复杂关联和结构特征,为用户提供更精准和可靠的信息。这些结构特征也被用于更好的捕捉电商行为中的异常。
image009
image011

另一方面超大规模认知图谱的计算与推理也给系统设计带来巨大挑战。下一个报告中,钱正平博士首先介绍了阿里基于图模型的智能服务系统架构,包括图模型的维护、数据智能计算,以及与人工、算法知识的融合,并最终提供实时的在线服务。接着钱博士从底层图存储、并行计算与高层语言抽象和优化等角度,重点介绍了系统挑战和阿里的工作。
image013
image015

此外钱正平博士还透露,阿里正在结合过去几年在真实场景的大规模应用与实践经验,研发新一代图计算引擎MaxGraph,支撑超大规模认知图谱推理计算。相比现有图存储或图数据库,MaxGraph为图模型提供了高效的分布式存储、支持实时更新与保证数据一致性;自研的分布式数据流引擎能支持包括交互查询,批量全图计算,和低延迟、高并发在线服务在内的多模式混合执行;另外通过兼容TinkerPop Gremlin等流行的图查询语言,和提供自研的能够表达图表征学习等更丰富图计算语义的高层描述性语言及自动优化,提供良好的可编程性。MaxGraph旨在为大规模知识图谱应用提供统一的计算引擎和更高层的系统抽象,在应用与底层硬件、网络之间架起桥梁,充分发挥硬件性能、突破计算规模与性能瓶颈。
image017

在最后的讨论环节,各位专家进一步展望了认知图谱与推理领域的发展、分享了研究挑战与机遇。钱博士强调了算法与系统工程紧密结合的重要性,更为重要的,是要和领域专家紧密协作、真正深入和解决真实场景的重要问题。相信超大规模认知图谱及计算能力,会成为更多AI应用的基础设施、并带动更多的行业创新。
image019

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径,限时直播课程免费报名中!欢迎戳“https://yq.aliyun.com/promotion/689”免费报名学习。
IMG_1996

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10062 0
Flink1.7.2 Dataset 并行计算源码分析
- 了解Flink处理流程(用户程序 -> JobGrapth -> ExecutionGraph -> JobVertex -> ExecutionVertex -> 并行度 -> Task(DataSourceTask,BatchTask,DataSinkTask) - 了解Execution...
1576 0
流计算精品翻译: The Dataflow Model
我们提出了Dataflow模型,并详细地阐述了它的语义,设计的核心原则,以及在实践开发过程中对模型的检验。
14048 0
MySQL:Innodb表 Data free 的计算概要
简单记录一下,因为看了一下Data free的计算还算准确。不是统计值大概是空闲extent的大小。 ST_FIELD_INFO tables_fields_info[]= {... {"DATA_FREE", MY_INT64_NUM_DECIMAL_DIGITS, MYSQL_TYPE_L...
4045 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13875 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
11888 0
Flink1.7.2 Dataset 文件切片计算方式和切片数据读取源码分析
了解读取的文件或目录,具体进行切片拆分的实现 了解任务读取切片中的数据规则
1176 0
【ATF】林伟:大数据计算平台的研究与实践
第七届阿里巴巴技术论坛上,阿里云资深专家林伟(花名:伟林)带来了以《大数据计算平台的研究与实践》为主题的深度分享。
5610 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7361 0
+关注
云攻略小攻
计算,存储,网络,数据库,企业应用服务,开发者服务统统在这里。
442
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载