云场景实践研究第53期:云贝网络科技

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
日志服务 SLS,月写入数据量 50GB 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 上海云贝网络科技的系统架构可以综述为:基于阿里云的基础设施做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务,基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。

更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽

上海云贝网络科技的系统架构可以综述为:基于阿里云的基础设施做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务,基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。

“独立的数据是没有用的,需要关联聚合在一起来使用。基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。如果企业把这些可以理解的数据放到一起做对于历史的回顾、对当前现状的分析、对未来的预测,那么这些数据就变成了企业的核心资产。”

——刘立兼

上海云贝网络科技有限公司首席架构师


采用的阿里云产品
  • 阿里云云服务器 ECS
  • 阿里云负载均衡 SLB
  • 阿里云对象存储 OSS
  • 阿里云数据库 RDS
  • 阿里云分析型数据库
  • 阿里云分布式关系型数据库服务DRDS
  • 阿里云大数据计算服务 MaxCompute
  • 阿里云企业级分布式应用服务 EDAS
  • 阿里云云监控

为什么使用阿里云

基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。

借助MaxCompute和数加的IDE可以清晰地表现数据加工的整个过程,做到了将设计和开发过程的统一。

阿里云平台所提的基础设施可以满足贝云在技术上的三个需求:可靠性,安全性,可维护性。


关于 上海云贝网络科技有限公司

上海云贝网络科技有限公司成立于2009年9月,是国内电商行业最专业的客户关系管理软件服务商。以会员为中心,致力于为用户提供最优秀的客户关系管理(CRM)系统建设和会员经营解决方案、咨询、研发、培训和实施服务的互联网企业。云贝始终秉持“严谨务实 精益求精”的产品研发理念,致力于为用户提供最先进的产品和技术,始终围绕客户关系管理系统建设及运营管理进行持续的技术创新和产品研发,现已独立研发了具有自主知识产权的《网聚宝》客户关系管理系统,为众多网商提供会员经营服务。专注电商会员经营,实现会员价值的最大化是我们的使命,云贝视服务质量为企业生命,视客户为企业之本,以服务客户为企业宗旨,以高效而良好的服务为客户切实节约成本、创造价值,赢得了广大用户的信赖与支持。


为什么选择阿里云?

云贝基于阿里云的总体架构设计

ac25c21da05537ffbf13164fe565b21b0291b773

上图所示的是贝云科技的架构设计总图,最上面的是客户价值的模型,它是为了说明贝云是如何基于阿里云来开发相应的产品和应用,最终在不同的商业过程中给客户提供价值。客户价值模型之下是五个产品线,其中包含了很多的产品模块。产品线之下是服务,属于比较中间的一层。从业务的角度来看,其实多个服务可以组合成产品线中的一个产品模块。从技术的角度看,服务具体就是指dubbo或edas的服务。服务之下主要是阿里云的产品套件,左边是数据中心,右边是服务所依赖的基础设施。最下层是数据采集的服务。


客户价值

95951d732375e5af4ab58108a4debe7b776ade85

根据客户价值来划分,左边涉及到成本,属于生产侧,右边涉及到收入,属于市场侧。按照大数据的观点来看,贝云的主要客户是电商和零售。首先,贝云使用的所有数据都是可积累的;其次,孤立的数据是没有用的,需要关联聚合在一起来使用。基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。如果企业把这些可以理解的数据放到一起做对于历史的回顾、对当前现状的分析、对未来的预测,那么这些数据就变成了企业的核心资产。所以数据是可以应用的:将数据应用在生产过程的方方面面,包括和上下游有关的整个供应链,那么数据就可以在生产侧提供竞争力;如果以客户为中心构建所有可以被理解的数据的话,就会形成以客户为中心的数据资产,它是可以使用在市场竞争层面的。所以,大数据从其原始数据的积累到生产和市场的竞争上来说,现在的基础设施是比较成熟的,最大的障碍反而是数据的积累、聚合。


产品线

0f07cff3acd5b882601ae02732adf0453c8d6d92

贝云主要有五个产品线。第一类是洞察产品线,包括报表、模板、数据可视化的大屏等。这些集合在一起主要是实现了数据的聚合、理解。所以其中有一个比较强的数据接入服务,可以把外部数据源(无论是哪种数据格式)接入,通过各种各样的算法进行理解。洞察产品线提供了客户的关键资源,最后反映到关键活动上去。

第二类是社交产品线。现在的电商和零售的客户属于终端类型的客户,客户和买家之间需要建立比较强的连接。社交产品线是维护客户关系的手段,由于很多的销售过程会在和客户的互动过程中默默地完成,所以从另外一个方面来说也可以是分销的渠道。

营销产品线包括复合营销、自动营销、多渠道营销等。其对于客户的价值也是很清楚的:首先通过大数据可以让客户更精细的去观察细分自己的客户,客户细分做的好又会提高分销渠道的利用率。营销产品线是触达客户的产品线,对于维持客户的关系也有很大的帮助。

客服在营销中占的比重是很大的,包括售前、售后等。客服产品线会改变客服的工作,原来客服的工作都是依赖于已有的客服系统或者线上平台的客服系统,这些系统其实更强调功能本身,并不在意客服本身能否沉淀数据。基于客服产品线,所有客服的行为数据都可以收集到。

协作产品线里面有一些日志、表格等东西。其主要解决关键活动、关键伙伴的问题。原来企业和合作伙伴的沟通比较低,协作产品线可以把自己的行为和合作伙伴关键的产生的数据化保存下来,可以产生更紧密的关联。


服务

7e2459fd0c3d4c8811a45cceab7323a07312c936

数据分析服务强调的是数据的关联、统计、聚合以及算法的分析,里面是要做很多计算的。效果分析是基于营销结果的再次营销,对复合营销和自动营销有很大的支持。透视表可以实现自动报表,所有的报表都可以根据自己的需求产生。报告关联应用于统计基盘。

156bd1b07221be2a209d40f15b8057c92719cb2b

数据应用服务并不强调数据的转换,但是强调数据和人之间的关系,人会依赖数据应用的服务来决定自己的行为,而行为又可以沉淀到这些数据服务里面。会员筛选可以助力智能分析,推广管理支撑了互动服务模块。


数据中心

b100c7b951e217b2be1aad3e71eaf56793a0695f

数据中心支持数据分析服务,数据中心和数据应用服务的关系是双向的。在数据TP部分,使用了关系型数据库集群、NoSQL型存储集群。关系型数据库主要用的RDS+DRDS做shading来实现。需要注意的是不是所有的数据都是关系型数据,而且虽然阿里云有DRDS来做数据库的shading,但是数据库的shading要和业务有很强的关联性,要基于业务做分层。NoSQL型存储集群左侧是结构比较弱的,右侧是结构比较强的。

数据加工部分,ETL工具主要用的是MaxCompute和数加的IDE,清晰的表现了数据加工的整个过程,做到了将设计和开发过程的统一。基于这两个工具做了很多数据加工的服务,比如回购周期、RFM等。

OLAP的数据库也有两种:离线报表数据库和实时分析数据库。离线数据库比较简单,但是对于数据探索的场景提供不了很好的支持。实时分析数据库中很重要的一个工具是数加的ADS。做数据的过程中会涉及到探索的场景,即分析出一部分内容需要根据内容做进一步的分析,过程一直循环下去,此场景是需要依靠实时的数据分析能力的。

0970e57b2bb890a77a3ec0829d6e4c713ef9468b

上图是数据可视化分类,数据分析服务包括旋转、钻取等,可视化有多维、网络等。分析型服务是为了满足探索型场景的,数加现在的分析型数据库可以很大程度上满足这个需求,这就是数据分析服务和传统数据报表服务很大的区别。数加的ADS有一定的限制, 对于分区的要求很严格,但是已经提供了相当程度的灵活性。左侧的数据分析引擎包括:公众趋势分析引擎(分析舆情)、推荐引擎、数据集成引擎(在做其他数据分析的时候把数据聚集在一起)。特点业务数据中心中,使用特点数据中心解决特定场景会事半功倍。数据中心不止做了上述工作,它还提供了数据API供二次开发者、集成商、合作伙伴使用。除了数据层面,上层的服务也可以提供,客户可以直接调用底层的数据分析服务。


基础设施

39cac57a2a48451f946e2bc4326c61b369cf7836

基础设施主要有四个部分,分别满足技术上的三个需求:可靠性,安全性,可维护性。微服务中间件套件主要解决可靠性的问题,开发和运维套件解决了可维护性的问题,全链路安全套件对应安全性的需求。其中,微服务中间件套件是核心部分,所有的开发都是基于这些服务之上的。

f9b435ddcad7f9682f915adbe03e58f8d0a13871

微服务中间件是开发的根本,因为所有的产品都是基于服务化开发的。现在的市场有一半的规模性复制成分,也有一半的探索性成分。对于探索性成分来说,架构上最好要支持比较强的大的中台(核心的、通用的、基础的能力)和小的前台(根据客户的特定场景、特定需求的服务)的方式。微服务框架上的为EDAS,原来是用Double来做的,因为Double在运维监控上的能力比较弱,需要自己来实现整个服务拓扑的关系。下层依赖云服务器集群和可配置容器集群。目前主要是用云服务器集群,因为ECS支持可自定义镜像。分布式队列中有消息队列是很正常的,任务调度在分析类服务中则是比较常见的。

771418e075cdf8d288a5f8e791a491bf31747ed0

开发套件中,目前的日志记录主要是做日志的收集、聚合。阿里云云监控中可视化的日志内容不仅是开发人员可以看懂,最好的日志是带有语义的日志。在持续发布里可以集成自己的脚本使得技术人员提交代码的时候检查代码的格式风格、代码的静态质量检查也会自启动、最近提交人的责任也会更新。数据管理DMS最大的价值在于其诊断记录,对于没有DBA的团队来说非常有意义。

运维套件中的自动部署对于运维人员来说好处非常大,因为实际上有一部分的销售是基于线下的,而线下的销售对于部署是有一定需求的,把常见的部署方式提前建好,需要时就可以做到一键部署,可以降低人力投入。资源监控是指阿里云的云监控,优点是完善、所有的硬件指标都有,缺点是不能跟系统里的实际业务打通。业务监控主要提供了实时数据的聚合能力。

f3146ce54dc4a81ec0dc45e2236ed162931641df

可靠性是通过微服务中间件套件来支持的,可维护性是通过开发套件和运维套件来支持的,安全性是通过全链路安全套件来支持的。其中,主要使用了web应用防御、移动应用防疫、服务器防护、内容安全


数据采集服务

45797f93f4093b0fb5fb6f256ccfdc99237b984f

数据源来自于数据采集服务,其受到底层基础设施的支持,最终的出口是数据中心。从业务的方式来看,数据采集主要通过第三方自有平台、公共电商平台、公开信息平台进行的。

bf1ca9370cd506cd4be2f3a81b47ce8516ca9c40

从技术方式来看数据源和同步之间的关系如上图所示。左侧是业务数据源,右侧是技术数据源(标准协议类数据源、文件类数据源、硬件数据)。采集方式抽象为两种:主动获得(API调用、爬虫、文件、协议)和被动推送(API推送、硬件端口、中间库)。数据采集有两种维度的数据转化:业务维度转化(从原始数据中把与业务有关维度的数据提取出来)、格式维度转化(把非数据化格式转为数据化格式)。


云贝网络基于阿里云的架构总结

架构可以综述为,基于阿里云的基础设施(可靠性、可维护性、安全性三个方面)做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务(包括Double服务和EDAS服务),基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。


关于云贝网络的更多实践详情:纯云大数据系统的构建与价值
原文发布日期:2017-03-13
云栖社区场景研究小组成员:贾子甲,仲浩。

相关文章
|
20天前
|
机器学习/深度学习 算法 PyTorch
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
本文探讨了图神经网络(GNN)与大型语言模型(LLM)结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型,然后深入分析了GNN-RAG架构,通过敏感性研究和架构改进,显著提升了模型的推理能力和答案质量。实验结果表明,改进后的模型在多个评估指标上取得了显著提升,特别是在精确率和召回率方面。最后,文章提出了反思机制和教师网络的概念,进一步增强了模型的推理能力。
50 4
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
|
8天前
|
运维 供应链 安全
阿里云先知安全沙龙(武汉站) - 网络空间安全中的红蓝对抗实践
网络空间安全中的红蓝对抗场景通过模拟真实的攻防演练,帮助国家关键基础设施单位提升安全水平。具体案例包括快递单位、航空公司、一线城市及智能汽车品牌等,在演练中发现潜在攻击路径,有效识别和防范风险,确保系统稳定运行。演练涵盖情报收集、无差别攻击、针对性打击、稳固据点、横向渗透和控制目标等关键步骤,全面提升防护能力。
|
30天前
|
机器学习/深度学习 人工智能 算法
深入解析图神经网络:Graph Transformer的算法基础与工程实践
Graph Transformer是一种结合了Transformer自注意力机制与图神经网络(GNNs)特点的神经网络模型,专为处理图结构数据而设计。它通过改进的数据表示方法、自注意力机制、拉普拉斯位置编码、消息传递与聚合机制等核心技术,实现了对图中节点间关系信息的高效处理及长程依赖关系的捕捉,显著提升了图相关任务的性能。本文详细解析了Graph Transformer的技术原理、实现细节及应用场景,并通过图书推荐系统的实例,展示了其在实际问题解决中的强大能力。
155 30
|
10天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN): 从理论到实践
本文将深入浅出地介绍卷积神经网络(CNN)的工作原理,并带领读者通过一个简单的图像分类项目,实现从理论到代码的转变。我们将探索CNN如何识别和处理图像数据,并通过实例展示如何训练一个有效的CNN模型。无论你是深度学习领域的新手还是希望扩展你的技术栈,这篇文章都将为你提供宝贵的知识和技能。
312 7
|
2月前
|
数据采集 XML 存储
构建高效的Python网络爬虫:从入门到实践
本文旨在通过深入浅出的方式,引导读者从零开始构建一个高效的Python网络爬虫。我们将探索爬虫的基本原理、核心组件以及如何利用Python的强大库进行数据抓取和处理。文章不仅提供理论指导,还结合实战案例,让读者能够快速掌握爬虫技术,并应用于实际项目中。无论你是编程新手还是有一定基础的开发者,都能在这篇文章中找到有价值的内容。
|
2月前
|
云安全 监控 安全
云计算环境下的网络安全策略与实践
在数字化时代,云计算已成为企业和个人存储、处理数据的重要方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨如何在云计算环境中实施有效的网络安全措施,包括加密技术、访问控制、安全监控和应急响应计划等方面。我们将通过具体案例分析,展示如何在实际场景中应用这些策略,以保护云中的数据不受威胁。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络:从理论到实践
【10月更文挑战第35天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为科技界的宠儿。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,在图像识别和视频分析等领域展现出了惊人的潜力。本文将深入浅出地介绍CNN的工作原理,并结合实际代码示例,带领读者从零开始构建一个简单的CNN模型,探索其在图像分类任务中的应用。通过本文,读者不仅能够理解CNN背后的数学原理,还能学会如何利用现代深度学习框架实现自己的CNN模型。
|
2月前
|
数据采集 网络协议 算法
移动端弱网优化专题(十四):携程APP移动网络优化实践(弱网识别篇)
本文从方案设计、代码开发到技术落地,详尽的分享了携程在移动端弱网识别方面的实践经验,如果你也有类似需求,这篇文章会是一个不错的实操指南。
76 1
|
2月前
|
监控 安全 网络安全
网络安全新前线:零信任架构的实践与挑战
网络安全新前线:零信任架构的实践与挑战
33 0

热门文章

最新文章