【2018中国计算机大会】阿里资深专家谈认知图谱的机遇与挑战

简介: 基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。

基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。

10月25日下午,2018中国计算机大会上举办了以“认知图谱与推理”为主题的技术论坛,领域专家与参会者们一起探讨了如何构建超大规模的认知图谱,及其在工业界实际场景中的应用,并深入探讨了数据智能、机器学习、图计算、认知推理等多方面的结合应用的理论方法与实践经验,现场参与观众爆满。
image001

论坛上,来自阿里巴巴达摩院智能计算实验室的数据科学家杨红霞博士和计算平台系统工程总监钱正平博士,分别从算法和系统角度,介绍了认知图谱在阿里电商推荐、视频分析、金融风控等领域的真实场景的生产实践。
16_29_16__11_02_2018

专家简介

杨红霞,阿里巴巴资深算法专家/总监。她带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。加入阿里之前,杨博士曾任IBM全球研发中心Watson研究员,Yahoo!主任数据科学家。在顶级统计和机器学习国际学术期刊会议发表论文40余篇(包括JASA, ICML, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,2017浙江省千人。杨博士毕业于美国杜克大学。

钱正平,阿里巴巴资深技术专家/总监。他带领团队负责围绕阿里巴巴内外诸如图计算、机器学习等新兴应用的系统研发和商业解决方案构建。加入阿里之前,钱博士曾任微软亚洲研究院主管研究员。研究兴趣是分布式和数据并行计算,在OSDI、NSDI、EuroSys、VLDB等会议发表论文、并曾获EuroSys 2012最佳论文奖。钱博士毕业于华南理工大学。

杨红霞博士介绍,阿里巴巴生态体系有着极其丰富多样的数据,涵盖着从购物、出行,到娱乐、支付等各个方面。作为信息过滤的重要手段和电商应用的核心服务,个性化推荐系统需要依赖这一数据,识别我们的习惯和爱好来推荐合适的商品或者服务。但是传统的推荐系统容易出现稀疏性、冷启动和信息重复性的问题,而认知图谱作为大规模图表征的一类重要模型正在成为一种新兴类型的推荐辅助信息,可以将自然人的全域信息有效的结合起来,真正挖掘、理解每个人的需求,在每个业务域推出消费者真正感兴趣的潜在商品。
image007

杨博士还具体以淘宝推荐算法为例,介绍了如何利用图表征学习等技术,融合异构信息,对于超过几十亿节点、千亿边的超大规模知识图谱上进行有效的推理分析。从而利用多样化数据间的复杂关联和结构特征,为用户提供更精准和可靠的信息。这些结构特征也被用于更好的捕捉电商行为中的异常。
image009
image011

另一方面超大规模认知图谱的计算与推理也给系统设计带来巨大挑战。下一个报告中,钱正平博士首先介绍了阿里基于图模型的智能服务系统架构,包括图模型的维护、数据智能计算,以及与人工、算法知识的融合,并最终提供实时的在线服务。接着钱博士从底层图存储、并行计算与高层语言抽象和优化等角度,重点介绍了系统挑战和阿里的工作。
image013
image015

此外钱正平博士还透露,阿里正在结合过去几年在真实场景的大规模应用与实践经验,研发新一代图计算引擎MaxGraph,支撑超大规模认知图谱推理计算。相比现有图存储或图数据库,MaxGraph为图模型提供了高效的分布式存储、支持实时更新与保证数据一致性;自研的分布式数据流引擎能支持包括交互查询,批量全图计算,和低延迟、高并发在线服务在内的多模式混合执行;另外通过兼容TinkerPop Gremlin等流行的图查询语言,和提供自研的能够表达图表征学习等更丰富图计算语义的高层描述性语言及自动优化,提供良好的可编程性。MaxGraph旨在为大规模知识图谱应用提供统一的计算引擎和更高层的系统抽象,在应用与底层硬件、网络之间架起桥梁,充分发挥硬件性能、突破计算规模与性能瓶颈。
image017

在最后的讨论环节,各位专家进一步展望了认知图谱与推理领域的发展、分享了研究挑战与机遇。钱博士强调了算法与系统工程紧密结合的重要性,更为重要的,是要和领域专家紧密协作、真正深入和解决真实场景的重要问题。相信超大规模认知图谱及计算能力,会成为更多AI应用的基础设施、并带动更多的行业创新。
image019

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径,限时直播课程免费报名中!欢迎戳“https://yq.aliyun.com/promotion/689”免费报名学习。
IMG_1996

相关文章
|
机器学习/深度学习 算法 数据可视化
浅析特征数据离散化的几种方法(上)
什么是离散化? 离散化就是把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:
|
10月前
|
人工智能 自然语言处理 API
MCP与A2A协议比较:人工智能系统互联与协作的技术基础架构
本文深入解析了人工智能领域的两项关键基础设施协议:模型上下文协议(MCP)与代理对代理协议(A2A)。MCP由Anthropic开发,专注于标准化AI模型与外部工具和数据源的连接,降低系统集成复杂度;A2A由Google发布,旨在实现不同AI代理间的跨平台协作。两者虽有相似之处,但在设计目标与应用场景上互为补充。文章通过具体示例分析了两种协议的技术差异及适用场景,并探讨了其在企业工作流自动化、医疗信息系统和软件工程中的应用。最后,文章强调了整合MCP与A2A构建协同AI系统架构的重要性,为未来AI技术生态系统的演进提供了方向。
1519 62
|
人工智能 安全 算法
多端融合,打造最优落地效果的多模态百炼
本次分享由阿里云智能集团飞天实验室资深产品专家江潇和科学家胡露露主讲,介绍了多端融合的多模态百炼产品。内容涵盖多模态模型的优化、生产力和产品力建设、RAG能力升级、终端大模型场景探索、内容安全和生态应用等方面。百炼已支持多模态模型调用,提升了模型效果和应用效果,并在安全性、模型优化和终端部署上取得了显著进展。
|
人工智能 分布式计算 大数据
云栖实录 | MaxCompute 迈向下一代的智能云数仓
2024年云栖大会上,阿里云核心自研云原生智能数据仓库产品MaxCompute,在经过一年的深度打磨后,推出了其迈向下一代智能云数据仓的系列主题分享。此次产品发布,充分展示MaxCompute产品领先行业的云数据产品发展理念与核心优势。
1713 2
|
机器学习/深度学习 人工智能 分布式计算
阿里云人工智能平台PAI论文入选OSDI '24
阿里云人工智能平台PAI的论文《Llumnix: Dynamic Scheduling for Large Language Model Serving》被OSDI '24录用。论文通过对大语言模型(LLM)推理请求的动态调度,大幅提升了推理服务质量和性价比。
|
Linux
Linux下采集摄像头的图像再保存为JPG图片存放到本地(YUYV转JPG)
Linux下采集摄像头的图像再保存为JPG图片存放到本地(YUYV转JPG)
2369 2
Linux下采集摄像头的图像再保存为JPG图片存放到本地(YUYV转JPG)
|
存储 分布式计算 NoSQL
2022云栖精选—云栖大会-图计算及其应用论坛
摘要:本文整理自达摩院的资深技术专家与图计算团队的负责人于文渊老师,在云栖大会“图计算及其应用”分论坛的分享。本篇内容主要分为六个部分: 1. 实时离线一体图计算引擎 2. 全新的图交互查询/模式匹配IR与引擎 3. 图分析引擎的全新升级 4. 图学习引擎的全新升级 5. 图可视化解决方案 6. 用户友好型与易用性提升
671 76
2022云栖精选—云栖大会-图计算及其应用论坛
|
人工智能 架构师 算法
通义万相、ModelScopeGPT等亮相2023世界人工智能大会
通义万相、ModelScopeGPT等亮相2023世界人工智能大会
1426 0
|
存储 机器学习/深度学习 人工智能
【2023云栖】黄博远:阿里云人工智能平台PAI年度发布
本文根据2023云栖大会阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人-黄博远演讲实录整理而成,演讲主题:阿里云人工智能平台PAI年度发布
【2023云栖】黄博远:阿里云人工智能平台PAI年度发布