如何在 G6VP 可视化平台使用 GraphScope 引擎

简介: 如何在 G6VP 可视化平台使用 GraphScope 引擎

本文来源:支付宝体验科技公众号


GraphScope 已成为图可视化与分析平台 G6VP[1] 的后端引擎,本篇文章主要介绍如何部署 G6VP 与 GraphScope 并进行数据分析。


什么是 G6VP


G6VP 是由蚂蚁集团 AntV 图可视化小组开源的图可视化与分析平台。用户可以在 G6VP 中连接自己的数据,包括本地文件上传,或多种图数据库,并组装 G6VP 提供的丰富图可视化与分析资产,进行数据分析,或设计和开发出自己的图可视分析产品,嵌入到自己的系统当中。




G6VP 与 GraphScope 的部署


目前,G6VP 支持了 GraphScope 作为后端服务。由于 G6VP 没有可用的在线服务器,因此与 GraphScope 引擎和服务的集成部署需要基于 Docker 镜像。当前 G6VP 仅支持 GraphScope 中持久化图存储(Groot)和交互式查询引擎(GIE)的联合部署模式,后续会持续完成 GraphScope 中分析式计算引擎(GAE)等的对接,提供一站式高效的解决方案。


镜像部署


在这一步骤中,我们需要通过 Docker 部署 GraphScope 服务,并启动 G6VP HTTP 服务,需要注意的是,两个服务所在的机器网络需要相通。


首先需要拉取并启动镜像:


docker pull registry.cn-hongkong.aliyuncs.com/graphscope/graphscope-store:httpserver
#  启动镜像,过程中需要映射端口以保证后续的查询服务可用
# 12312: gremlin 查询端口
# 9527: http 服务端口
docker run -d -p 12312:12312 -p 9527:9527 registry.cn-hongkong.aliyuncs.com/graphscope/graphscope-store:httpserver


GraphScope 持久化存储容器启动成功后,会载入默认的数据集,如果你想导入自己的数据集,可参考 Groot 文档[2]。用户可以执行如下命令,检测容器是否正常运行:


// 注意服务器运行容器时,替换 localhost 地址为服务器 IP
curl http://localhost:9527/api/v1/graph


部署成功后,得到 GraphScope 引擎地址为 http://localhost:9527,在后面的「G6VP 接入 GraphScope 服务」步骤中将使用到。


启动 G6VP 代理服务


目前有两种方式来启动 G6VP 的代理服务:


  1. 使用二进制安装包直接启动


访问 G6VP 开源仓库,下载 gi-httpservices.tgz 文件[3]并解压,然后进入文件夹启动服务,在此之前请先确保本机电脑有 NodeJS 环境。


cd gi-httpservice
# make sure port 7001 is available
lsof -i:7001
npm run start


  1. 从源代码安装启动


在克隆 G6VP 代码后,进入 G6VP/packages/gi-httpservice 文件夹,并安装依赖,最后启动 httpservice:


git clone https://github.com/antvis/G6VP.git
cd G6VP/packages/gi-httpservice
npm install
npm run dev


此时,G6VP HTTP 服务启动完成,访问 http://localhost:7001/,(默认端口 7001),可以在控制台看到下面提示:


image.png


G6VP 接入 GraphScope 服务


连接 GraphScope 服务,首先需要填写上面步骤中得到的平台地址和引擎地址:


  • 平台地址:G6VP HTTP 服务地址,上文为 http://localhost:7001
  • 引擎地址:GraphScope 服务地址,上文为 http://localhost:9527

image.png

点击「开始连接」,若成功连接,右上方将出现下图提示,下方将出现「选择子图」 panel:

image.png

「选择子图」的下拉框中列举了该 GraphScope 服务中的所有子图名称,选择其中一个,然后在「数据名称」中为当前创建的 G6VP 数据集起一个名字,例子中起名为 “crew_graph”。再点击「进入分析」,即可创建数据集成功,页面将跳转到「数据集」模块,您将在数据集列表中看到刚刚创建的名为 “crew_graph” G6VP 数据集:

image.png

点击对应数据集右侧的电脑 icon,即使用该数据集创建工作簿,此时,页面跳转到新建工作簿页面,数据集和模版已为您填充好,在「工作簿名称」输入框为该工作簿起一个名称,然后点击「创建画布」,即可进入工作簿。

image.png

点击「创建画布」后,您将看到一个空白的画布,以及左侧的配置面板:

image.png


利用 G6VP 和 GraphScope 分析数据


经过上述步骤,我们已经完成了 GraphScope 的连接和数据、工作簿的创建,然后就可以在刚刚新建的工作簿中进行数据分析了。在工作簿中配置 Gremlin 查询资产,输入 Gremlin 查询语句,例如下图中的 g.V().limit(10),即可成功查询到数据:

image.png

如果目前节点和边的样式不符合您的要求,可以在「样式」中进行配置:

image.png

选择一个或多个节点,在节点的右键菜单中,选择「一度扩展」,进行该节点的邻居查询:

image.png

如果这个邻居扩散资产不符合需求,可以在左侧面板进行配置:

image.png

此外,用户可以使用过滤取来分析统计数据,我们提供了过滤器的智能推荐:

image.png

上面仅仅介绍了最为基础的功能,还有大量超酷的图分析资产可以在资产中心找到。


最后,别忘了保存刚刚配置完成的工作簿,下次进入 G6VP,就可以在工作簿列表中找到这个工作簿了。所有的数据信息、工作簿配置信息都存储在用户的电脑本地缓存,G6VP 不会获取任何用户数据信息。

image.png

如果您想将这个工作簿嵌入到您的系统当中,可以点击右上角的「开放」,有三种方式可以导出:

image.png

更多的用法和文档可以访问 G6VP 官方文档[4],如果有任何问题,都可以到 G6VP 的 GitHub [5]中提 issue。


结语


通过 G6VP 与 GraphScope 的联合部署,用户可以很简单地管理、创建图数据,并利用 GraphScope 的强大能力,执行各种图计算任务。未来 GraphScope 的更多计算引擎将与 G6VP 进行集成,尽情期待!感兴趣的读者可以点击【阅读原文】进入 G6VP 官方网站,访问更多内容。


参考资料


[1]G6VP: https://insight.antv.antgroup.com/
[2]Groot 文档: https://graphscope.io/docs/latest/storage_engine/groot
[3]gi-httpservices.tgz 文件: https://github.com/antvis/G6VP/blob/master/release/gi-httpservice.tgz
[4]G6VP 官方文档: https://www.yuque.com/antv/gi
[5]G6VP 的 GitHub : https://github.com/antvis/g6vp

相关文章
|
6月前
|
SQL Java 大数据
5款开源BI工具优缺点及介绍
【4月更文挑战第15天】对比了几款开源BI报表工具:Superset以其高性能和高度可定制化受青睐,适合复杂分析;Metabase以其简洁易用和广泛兼容性脱颖而出,适合快速构建报表;DataEase以其轻量级和易部署特点吸引中小型企业;JasperReports擅长复杂报表生成,适合Java环境;Pentaho CE则是一体化平台,适合需要全面企业级功能的用户。选择时应结合公司需求、技术背景和数据规模来决定。
2263 6
|
6月前
|
数据可视化 测试技术 BI
如何设计BI产品的自动化框架
如何设计BI产品的自动化框架
|
6月前
|
边缘计算 安全 算法
阿里云丁玉杰:构建全场景服务引擎
2023全球边缘计算大会·上海站,阿里云边缘云演讲分享
185 0
|
存储 数据可视化 数据管理
Ganos三维引擎系列(三):BIM数据管理与可视化功能解析
本文介绍了阿里云多模态时空数据库Ganos三维引擎在BIM数据管理中的应用。Ganos三维引擎支持三大类存储结构:表面网格模型、体网格模型与3D实景模型,其中表面网格模型(SFMesh)用于存储带有语义的类BIM精细化三维模型,同时提供了空间索引、分析算子、导入工具、可视化支撑等功能,本文详细介绍表面网格模型应用于IFC格式的BIM数据管理与可视化等功能。
|
分布式计算 大数据 BI
开源XL-LightHouse与Flink、ClickHouse之类技术相比有什么优势
Flink是一款非常优秀的流式计算框架,而ClickHouse是一款非常优秀的OLAP类引擎,它们是各自所处领域的佼佼者,这一点是毋庸置疑的。Flink除了各种流式计算场景外也必然可以用于流式统计,ClickHouse同样也可以用于流式统计,但我不认为它们是优秀的流式统计工具。XL-Lighthouse在流式统计这个细分场景内足以完胜Flink和ClickHouse。在企业数据化运营领域,面对繁杂的流式数据统计需求,以Flink和ClickHouse以及很多同类技术方案为核心的架构设计不能算是一种较为优秀的解决方案。
|
机器学习/深度学习 人工智能 达摩院
开源!一文了解阿里一站式图计算平台GraphScope
随着大数据的爆发,图数据的应用规模不断增长,现有的图计算系统仍然存在一定的局限。阿里巴巴拥有全球最大的商品知识图谱,在丰富的图场景和真实应用的驱动下,阿里巴巴达摩院智能计算实验室研发并开源了全球首个一站式超大规模分布式图计算平台GraphScope,并入选中国科学技术协会“科创中国”平台。本文详解图计算的原理和应用及GraphScope的架构设计。
开源!一文了解阿里一站式图计算平台GraphScope
|
存储 Prometheus 运维
阿里云ES全观测引擎TimeStream时序增强功能重磅发布,助力时序场景实现最佳实践
阿里云ES全观测引擎TimeStream时序增强功能最新发布,在云原生ELK全托管基础上,通过TimeStream时序增强功能插件,可实现高性能、低成本时序数据存储和查询分析。本文介绍TimeStream适用场景、功能优势、性能测试结果和实践案例
2191 0
|
移动开发 数据可视化 JavaScript
从零设计可视化大屏搭建引擎
几个月前我写了一篇关于从零开发一款可视化大屏制作平台 的文章, 简单概述了一下可视化大屏搭建平台的一些设计思路和效果演示, 这篇文章我会就 如何设计可视化大屏搭建引擎 这一主题, 详细介绍一下实现原理。
392 0