阿里云图数据库GDB助力钉钉构建百亿量级知识图谱

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,通用型 2核4GB
简介: 客户简介钉钉(DingTalk)是阿里巴巴集团专为中国企业打造的免费沟通和协同的多端平台,提供PC版,Web版和手机版,有考勤打卡、签到、审批、日志、公告、钉盘、钉邮等强大功能。钉钉因中国企业而生,帮助中国企业通过系统化的解决方案,全方位提升中国企业沟通和协同效率。

合作概述
钉钉用户数目前已突破3亿,成长为中国领先的智能移动办公平台。借助阿里云图数据库GDB,钉钉可高效处理百亿量级人与人、人与企业、企业与企业间的复杂关联关系数据,并构建了工作场景下的知识图谱,具备深度关联关系的挖掘能力。在推荐加人,拉新促活等场景取得了良好效果。

客户简介
钉钉(DingTalk)是阿里巴巴集团专为中国企业打造的免费沟通和协同的多端平台,提供PC版,Web版和手机版,有考勤打卡、签到、审批、日志、公告、钉盘、钉邮等强大功能。钉钉因中国企业而生,帮助中国企业通过系统化的解决方案,全方位提升中国企业沟通和协同效率。

业务痛点
钉钉天然存在有人人、人企、企企间的复杂关系,形成庞大的用户、组织网络,使得基于网络的社区聚类、关系裂变传播等成为可能,进而用于大规模的拉新、用户促活、工作人脉沉淀等等。经过多年的建设,钉钉已经沉淀了各个数据域的数据资产,但仍存在如下问题:
 缺少统一的关系数据沉淀
例如我们需要查询一个人在多个组织下有多少个同事时,需要多次关联用户组织关系表才能获得。特别是在在线推荐服务场景,需要做大量的关系扩散计算,分散的关系数据已经很难支撑起算法的进一步发展。因此我们需要构建一个统一的关系数据服务,提供离线和在线的数据查询及多度图扩散。
 缺乏关系的深度认知和推断
目前钉钉的数仓建设主要围绕着客观数据,而在具体的业务场景中,往往需要对数据更深入地认知和推断。例如在推荐加人场景中,我们需要进行同企识别,推荐用户的潜在同事。

解决方案
钉钉团队经过多方调研论证,发现图数据库在处理海量关联关系数据方面具有查询效率高,模型直观,编程简便的独有优势,在知识图谱、社交推荐等领域有广泛应用,非常契合钉钉知识图谱应用场景。
而阿里云GDB是一款支持ACID事务,兼容Gremlin和Cyper两大主流查询语言,提供99.95%企业级高可用保障的全托管在线图数据库。并提供免费的专家服务,给客户提供建模指导和一对一的解决方案。
image
图数据库GDB支撑了钉钉百亿量级用户关系的存储和高效查询,为钉钉构建知识图谱,提供了深度关联关系的挖掘能力。在以下场景取得了良好效果:
 推荐加人
在钉钉上创建团队后,管理员需要从通讯录一个个选择,或者手动输入手机号码进行加入, 加人效率低。如果能为用户推荐一些潜在同事,帮助其实现一键添加,那么用户组建团队就会更加方便。推荐加人实际上属于职场社交推荐,我们基于DingTalk Graph实现了整个召回、排序链路。
image

 拉新促活
邀请好友是App产品常用的一种拉新、促活方式。通过激励用户邀请好友、创建组织,可以为钉钉带来新用户、曝光度、留存率、活跃度,甚至形成裂变。我们基于DingTalk Graph构建了一个邀请能力模型(Invitation ability Model)来建模一个人在其工作社交网络中的邀请能力。
image

客户价值
图数据库GDB支撑了钉钉百亿量级用户关系的存储和高效查询,为钉钉构建知识图谱,提供了深度关联关系的挖掘能力。在推荐加人、拉新促活等应用场景得到广泛应用。
•百亿点边存储和ms级查询能力:针对图结构数据的存取特点,在图计算层和图存储层均进行了高度优化,满足钉钉百亿量级点边海量数据的多度关系毫秒级查询需求。
•服务高可用:GDB采用主备高可用架构,提供99.95%企业级SLA保障。当主节点故障时,系统自动切换,保障钉钉的业务连续性。
•易用、易运维:云服务全托管,提供备份恢复、自动升级、监控告警、实例升降配等丰富功能,大幅降低钉钉使用和维护图数据库的难度,使钉钉可以专注于应用本身的开发。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
2天前
|
弹性计算 自然语言处理 开发工具
基于阿里云向量检索 Milvus 版和 LangChain 快速构建 LLM 问答系统
本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI(EAS)模型服务,构建一个由LLM(大型语言模型)驱动的问题解答应用,并着重演示了如何搭建基于这些技术的RAG对话系统。
|
1天前
|
算法 Go 分布式数据库
构建高可用的分布式数据库集群:使用Go语言与Raft共识算法
随着数据量的爆炸式增长,单一数据库服务器已难以满足高可用性和可扩展性的需求。在本文中,我们将探讨如何使用Go语言结合Raft共识算法来构建一个高可用的分布式数据库集群。我们不仅会介绍Raft算法的基本原理,还会详细阐述如何利用Go语言的并发特性和网络编程能力来实现这一目标。此外,我们还将分析构建过程中可能遇到的挑战和解决方案,为读者提供一个完整的实践指南。
|
2天前
|
监控 Cloud Native 大数据
即刻预约|阿里云数据库 SelectDB 版商业化发布会,5月21日14:00与您相约
2024年5月2日14:00,阿里云数据库 SelectDB 版商业化产品发布会将于线上重磅举行,即刻开启预约!👇 直播地址:https://developer.aliyun.com/special/selectdb?utm_content=g_1000393528
92 0
即刻预约|阿里云数据库 SelectDB 版商业化发布会,5月21日14:00与您相约
|
2天前
|
Cloud Native 关系型数据库 分布式数据库
PolarDB是阿里云自主研发的关系型云原生数据库
【5月更文挑战第14天】PolarDB是阿里云自主研发的关系型云原生数据库
30 3
|
2天前
|
SQL 关系型数据库 Serverless
阿里云关系型数据库RDS
阿里云关系型数据库RDS
15 2
|
2天前
|
存储 监控 中间件
构建高性能数据库的秘诀
【5月更文挑战第13天】构建高性能数据库涉及硬件选型(如SSD、RAID)、内存与CPU优化、网络带宽保障。数据库设计要平衡规范化与反规范化,合理使用索引,考虑分区和分片技术。定期备份恢复、监控日志、维护和参数调优是管理关键。使用内存数据库、列式存储、分布式数据库和中间件能进一步提升性能。综合优化可打造稳定高效的数据库系统,支持企业成功。
|
2天前
|
安全 Devops 测试技术
深入了解阿里云云效DevOps:构建高效软件开发实践
阿里云云效DevOps,集成CI/CD与自动化测试,提升开发效率。支持持续集成确保代码质量,自动化测试加速交付,多环境及灰度发布保障安全可靠性。助团队构建高效开发实践,增强竞争力。
16 1
|
2天前
|
SQL 人工智能 自然语言处理
利用LangChain构建的智能数据库操作系统
LangChain库简化了数据库与AI结合,通过LLM将自然语言转为SQL语句进行查询和数据分析。它降低了数据查询的门槛,支持创建基于数据库的问答机器人和数据分析面板。实战案例展示了如何使用LangChain进行查询并以自然语言形式返回结果。通过限制表名,可处理大量数据。总结:掌握LangChain在数据库操作、查询及结果自然语言转换的应用。
22 0
|
2天前
|
Cloud Native 关系型数据库 分布式数据库
数据库性能诊断工具DBdoctor通过阿里云PolarDB产品生态集成认证
DBdoctor(V3.1.0)成功通过阿里云PolarDB分布式版(V2.3)集成认证,展现优秀兼容性和稳定性。此工具是聚好看科技的内核级数据库性能诊断产品,运用eBPF技术诊断SQL执行,提供智能巡检、根因分析和优化建议。最新版V3.1.1增加了对PolarDB-X和OceanBase的支持,以及基于cost的索引诊断功能。PolarDB-X是阿里巴巴的高性能云原生分布式数据库,兼容MySQL生态。用户可通过提供的下载地址、在线试用链接和部署指南体验DBdoctor。
|
2天前
|
存储 监控 Apache
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
网易的灵犀办公和云信利用 Apache Doris 改进了大规模日志和时序数据处理,取代了 Elasticsearch 和 InfluxDB。Doris 实现了更低的服务器资源消耗和更高的查询性能,相比 Elasticsearch,查询速度提升至少 11 倍,存储资源节省达 70%。Doris 的列式存储、高压缩比和倒排索引等功能,优化了日志和时序数据的存储与分析,降低了存储成本并提高了查询效率。在灵犀办公和云信的实际应用中,Doris 显示出显著的性能优势,成功应对了数据增长带来的挑战。
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践