云场景实践研究第53期:云贝网络科技

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 上海云贝网络科技的系统架构可以综述为:基于阿里云的基础设施做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务,基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。

更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽

上海云贝网络科技的系统架构可以综述为:基于阿里云的基础设施做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务,基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。

“独立的数据是没有用的,需要关联聚合在一起来使用。基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。如果企业把这些可以理解的数据放到一起做对于历史的回顾、对当前现状的分析、对未来的预测,那么这些数据就变成了企业的核心资产。”

——刘立兼

上海云贝网络科技有限公司首席架构师


采用的阿里云产品
  • 阿里云云服务器 ECS
  • 阿里云负载均衡 SLB
  • 阿里云对象存储 OSS
  • 阿里云数据库 RDS
  • 阿里云分析型数据库
  • 阿里云分布式关系型数据库服务DRDS
  • 阿里云大数据计算服务 MaxCompute
  • 阿里云企业级分布式应用服务 EDAS
  • 阿里云云监控

为什么使用阿里云

基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。

借助MaxCompute和数加的IDE可以清晰地表现数据加工的整个过程,做到了将设计和开发过程的统一。

阿里云平台所提的基础设施可以满足贝云在技术上的三个需求:可靠性,安全性,可维护性。


关于 上海云贝网络科技有限公司

上海云贝网络科技有限公司成立于2009年9月,是国内电商行业最专业的客户关系管理软件服务商。以会员为中心,致力于为用户提供最优秀的客户关系管理(CRM)系统建设和会员经营解决方案、咨询、研发、培训和实施服务的互联网企业。云贝始终秉持“严谨务实 精益求精”的产品研发理念,致力于为用户提供最先进的产品和技术,始终围绕客户关系管理系统建设及运营管理进行持续的技术创新和产品研发,现已独立研发了具有自主知识产权的《网聚宝》客户关系管理系统,为众多网商提供会员经营服务。专注电商会员经营,实现会员价值的最大化是我们的使命,云贝视服务质量为企业生命,视客户为企业之本,以服务客户为企业宗旨,以高效而良好的服务为客户切实节约成本、创造价值,赢得了广大用户的信赖与支持。


为什么选择阿里云?

云贝基于阿里云的总体架构设计

ac25c21da05537ffbf13164fe565b21b0291b773

上图所示的是贝云科技的架构设计总图,最上面的是客户价值的模型,它是为了说明贝云是如何基于阿里云来开发相应的产品和应用,最终在不同的商业过程中给客户提供价值。客户价值模型之下是五个产品线,其中包含了很多的产品模块。产品线之下是服务,属于比较中间的一层。从业务的角度来看,其实多个服务可以组合成产品线中的一个产品模块。从技术的角度看,服务具体就是指dubbo或edas的服务。服务之下主要是阿里云的产品套件,左边是数据中心,右边是服务所依赖的基础设施。最下层是数据采集的服务。


客户价值

95951d732375e5af4ab58108a4debe7b776ade85

根据客户价值来划分,左边涉及到成本,属于生产侧,右边涉及到收入,属于市场侧。按照大数据的观点来看,贝云的主要客户是电商和零售。首先,贝云使用的所有数据都是可积累的;其次,孤立的数据是没有用的,需要关联聚合在一起来使用。基于阿里云的数加平台,数据进行聚合变得并不难了。人工智能、深度学习可以使数据变得可被理解。如果企业把这些可以理解的数据放到一起做对于历史的回顾、对当前现状的分析、对未来的预测,那么这些数据就变成了企业的核心资产。所以数据是可以应用的:将数据应用在生产过程的方方面面,包括和上下游有关的整个供应链,那么数据就可以在生产侧提供竞争力;如果以客户为中心构建所有可以被理解的数据的话,就会形成以客户为中心的数据资产,它是可以使用在市场竞争层面的。所以,大数据从其原始数据的积累到生产和市场的竞争上来说,现在的基础设施是比较成熟的,最大的障碍反而是数据的积累、聚合。


产品线

0f07cff3acd5b882601ae02732adf0453c8d6d92

贝云主要有五个产品线。第一类是洞察产品线,包括报表、模板、数据可视化的大屏等。这些集合在一起主要是实现了数据的聚合、理解。所以其中有一个比较强的数据接入服务,可以把外部数据源(无论是哪种数据格式)接入,通过各种各样的算法进行理解。洞察产品线提供了客户的关键资源,最后反映到关键活动上去。

第二类是社交产品线。现在的电商和零售的客户属于终端类型的客户,客户和买家之间需要建立比较强的连接。社交产品线是维护客户关系的手段,由于很多的销售过程会在和客户的互动过程中默默地完成,所以从另外一个方面来说也可以是分销的渠道。

营销产品线包括复合营销、自动营销、多渠道营销等。其对于客户的价值也是很清楚的:首先通过大数据可以让客户更精细的去观察细分自己的客户,客户细分做的好又会提高分销渠道的利用率。营销产品线是触达客户的产品线,对于维持客户的关系也有很大的帮助。

客服在营销中占的比重是很大的,包括售前、售后等。客服产品线会改变客服的工作,原来客服的工作都是依赖于已有的客服系统或者线上平台的客服系统,这些系统其实更强调功能本身,并不在意客服本身能否沉淀数据。基于客服产品线,所有客服的行为数据都可以收集到。

协作产品线里面有一些日志、表格等东西。其主要解决关键活动、关键伙伴的问题。原来企业和合作伙伴的沟通比较低,协作产品线可以把自己的行为和合作伙伴关键的产生的数据化保存下来,可以产生更紧密的关联。


服务

7e2459fd0c3d4c8811a45cceab7323a07312c936

数据分析服务强调的是数据的关联、统计、聚合以及算法的分析,里面是要做很多计算的。效果分析是基于营销结果的再次营销,对复合营销和自动营销有很大的支持。透视表可以实现自动报表,所有的报表都可以根据自己的需求产生。报告关联应用于统计基盘。

156bd1b07221be2a209d40f15b8057c92719cb2b

数据应用服务并不强调数据的转换,但是强调数据和人之间的关系,人会依赖数据应用的服务来决定自己的行为,而行为又可以沉淀到这些数据服务里面。会员筛选可以助力智能分析,推广管理支撑了互动服务模块。


数据中心

b100c7b951e217b2be1aad3e71eaf56793a0695f

数据中心支持数据分析服务,数据中心和数据应用服务的关系是双向的。在数据TP部分,使用了关系型数据库集群、NoSQL型存储集群。关系型数据库主要用的RDS+DRDS做shading来实现。需要注意的是不是所有的数据都是关系型数据,而且虽然阿里云有DRDS来做数据库的shading,但是数据库的shading要和业务有很强的关联性,要基于业务做分层。NoSQL型存储集群左侧是结构比较弱的,右侧是结构比较强的。

数据加工部分,ETL工具主要用的是MaxCompute和数加的IDE,清晰的表现了数据加工的整个过程,做到了将设计和开发过程的统一。基于这两个工具做了很多数据加工的服务,比如回购周期、RFM等。

OLAP的数据库也有两种:离线报表数据库和实时分析数据库。离线数据库比较简单,但是对于数据探索的场景提供不了很好的支持。实时分析数据库中很重要的一个工具是数加的ADS。做数据的过程中会涉及到探索的场景,即分析出一部分内容需要根据内容做进一步的分析,过程一直循环下去,此场景是需要依靠实时的数据分析能力的。

0970e57b2bb890a77a3ec0829d6e4c713ef9468b

上图是数据可视化分类,数据分析服务包括旋转、钻取等,可视化有多维、网络等。分析型服务是为了满足探索型场景的,数加现在的分析型数据库可以很大程度上满足这个需求,这就是数据分析服务和传统数据报表服务很大的区别。数加的ADS有一定的限制, 对于分区的要求很严格,但是已经提供了相当程度的灵活性。左侧的数据分析引擎包括:公众趋势分析引擎(分析舆情)、推荐引擎、数据集成引擎(在做其他数据分析的时候把数据聚集在一起)。特点业务数据中心中,使用特点数据中心解决特定场景会事半功倍。数据中心不止做了上述工作,它还提供了数据API供二次开发者、集成商、合作伙伴使用。除了数据层面,上层的服务也可以提供,客户可以直接调用底层的数据分析服务。


基础设施

39cac57a2a48451f946e2bc4326c61b369cf7836

基础设施主要有四个部分,分别满足技术上的三个需求:可靠性,安全性,可维护性。微服务中间件套件主要解决可靠性的问题,开发和运维套件解决了可维护性的问题,全链路安全套件对应安全性的需求。其中,微服务中间件套件是核心部分,所有的开发都是基于这些服务之上的。

f9b435ddcad7f9682f915adbe03e58f8d0a13871

微服务中间件是开发的根本,因为所有的产品都是基于服务化开发的。现在的市场有一半的规模性复制成分,也有一半的探索性成分。对于探索性成分来说,架构上最好要支持比较强的大的中台(核心的、通用的、基础的能力)和小的前台(根据客户的特定场景、特定需求的服务)的方式。微服务框架上的为EDAS,原来是用Double来做的,因为Double在运维监控上的能力比较弱,需要自己来实现整个服务拓扑的关系。下层依赖云服务器集群和可配置容器集群。目前主要是用云服务器集群,因为ECS支持可自定义镜像。分布式队列中有消息队列是很正常的,任务调度在分析类服务中则是比较常见的。

771418e075cdf8d288a5f8e791a491bf31747ed0

开发套件中,目前的日志记录主要是做日志的收集、聚合。阿里云云监控中可视化的日志内容不仅是开发人员可以看懂,最好的日志是带有语义的日志。在持续发布里可以集成自己的脚本使得技术人员提交代码的时候检查代码的格式风格、代码的静态质量检查也会自启动、最近提交人的责任也会更新。数据管理DMS最大的价值在于其诊断记录,对于没有DBA的团队来说非常有意义。

运维套件中的自动部署对于运维人员来说好处非常大,因为实际上有一部分的销售是基于线下的,而线下的销售对于部署是有一定需求的,把常见的部署方式提前建好,需要时就可以做到一键部署,可以降低人力投入。资源监控是指阿里云的云监控,优点是完善、所有的硬件指标都有,缺点是不能跟系统里的实际业务打通。业务监控主要提供了实时数据的聚合能力。

f3146ce54dc4a81ec0dc45e2236ed162931641df

可靠性是通过微服务中间件套件来支持的,可维护性是通过开发套件和运维套件来支持的,安全性是通过全链路安全套件来支持的。其中,主要使用了web应用防御、移动应用防疫、服务器防护、内容安全


数据采集服务

45797f93f4093b0fb5fb6f256ccfdc99237b984f

数据源来自于数据采集服务,其受到底层基础设施的支持,最终的出口是数据中心。从业务的方式来看,数据采集主要通过第三方自有平台、公共电商平台、公开信息平台进行的。

bf1ca9370cd506cd4be2f3a81b47ce8516ca9c40

从技术方式来看数据源和同步之间的关系如上图所示。左侧是业务数据源,右侧是技术数据源(标准协议类数据源、文件类数据源、硬件数据)。采集方式抽象为两种:主动获得(API调用、爬虫、文件、协议)和被动推送(API推送、硬件端口、中间库)。数据采集有两种维度的数据转化:业务维度转化(从原始数据中把与业务有关维度的数据提取出来)、格式维度转化(把非数据化格式转为数据化格式)。


云贝网络基于阿里云的架构总结

架构可以综述为,基于阿里云的基础设施(可靠性、可维护性、安全性三个方面)做了数据采集服务,获取到数据之后流向了数据中心,数据中心不仅保存了原始数据还进行了加工,最终向上提供了产品的底层服务(包括Double服务和EDAS服务),基于服务又产生了5个产品线分别给客户在商业模式的不同部分中提供价值,最终来实现客户自身价值的提升。


关于云贝网络的更多实践详情:纯云大数据系统的构建与价值
原文发布日期:2017-03-13
云栖社区场景研究小组成员:贾子甲,仲浩。

相关文章
|
1天前
|
安全 网络安全 数据安全/隐私保护
网络安全的守护者:漏洞管理与加密技术的实践之路
【9月更文挑战第33天】在数字时代的浪潮中,网络安全成为了维护信息资产安全的关键防线。本文将深入探讨网络安全中的两个核心要素——漏洞管理和加密技术,揭示它们如何协同工作以保护我们的在线世界。我们将通过实际案例,展示这些技术如何在现实世界中发挥作用,并强调安全意识的重要性。无论你是IT专业人士还是普通网民,这篇文章都将为你提供宝贵的知识和启示。
|
3天前
|
机器学习/深度学习 人工智能 算法
深入理解卷积神经网络:从理论到实践
【9月更文挑战第31天】在深度学习的众多模型之中,卷积神经网络(CNN)以其在图像处理领域的出色表现而闻名。本文将通过浅显易懂的语言和直观的比喻,带领读者了解CNN的核心原理和结构,并通过一个简化的代码示例,展示如何实现一个简单的CNN模型。我们将从CNN的基本组成出发,逐步深入到其在现实世界中的应用,最后探讨其未来的可能性。文章旨在为初学者提供一个清晰的CNN入门指南,同时为有经验的开发者提供一些深入思考的视角。
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)入门与实践
【8月更文挑战第62天】本文以浅显易懂的方式介绍了深度学习领域中的核心技术之一——卷积神经网络(CNN)。文章通过生动的比喻和直观的图示,逐步揭示了CNN的工作原理和应用场景。同时,结合具体的代码示例,引导读者从零开始构建一个简单的CNN模型,实现对图像数据的分类任务。无论你是深度学习的初学者还是希望巩固理解的开发者,这篇文章都将为你打开一扇通往深度学习世界的大门。
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的奥秘:探索神经网络背后的原理与实践
【9月更文挑战第29天】本文将带你深入理解深度学习的核心概念,从基础理论到实际应用,逐步揭示其神秘面纱。我们将探讨神经网络的工作原理,并通过实际代码示例,展示如何构建和训练一个简单的深度学习模型。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供宝贵的知识和技能。
15 2
|
15天前
|
机器学习/深度学习 人工智能 算法
深度学习中的卷积神经网络(CNN)入门与实践
【9月更文挑战第19天】在这篇文章中,我们将探索深度学习的一个重要分支——卷积神经网络(CNN)。从基础概念出发,逐步深入到CNN的工作原理和实际应用。文章旨在为初学者提供一个清晰的学习路径,并分享一些实用的编程技巧,帮助读者快速上手实践CNN项目。
|
16天前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:构建安全防线的关键技术与实践
本文旨在探讨网络安全与信息安全领域的核心要素,包括网络安全漏洞、加密技术以及安全意识的重要性。通过深入分析这些关键技术和概念,旨在为读者提供一套全面的安全防范策略,帮助个人和企业更好地应对日益增长的网络威胁,保护自身信息资产安全。
|
18天前
|
存储 监控 安全
网络安全与信息安全:保护数据的重要性与实践措施
本文深入探讨了网络安全和信息安全领域内的关键概念,包括网络漏洞、加密技术以及安全意识的重要性。通过分析这些要素,文章提供了实用的策略来增强个人和企业的数据保护能力。我们将探讨如何识别和防范潜在的网络威胁,并强调了持续更新安全知识和采取预防措施的必要性。
|
28天前
|
云安全 安全 网络安全
云计算环境下的网络安全策略与实践
【9月更文挑战第6天】在数字化浪潮中,云计算已成为企业转型和创新的强大引擎。随之而来的网络安全挑战亦日益突出,成为制约云服务发展的关键因素。本文深入探讨了云计算环境中的安全风险,并提出了一系列切实可行的网络安全策略。从基础的数据加密到高级的身份验证机制,再到细致的访问控制和入侵检测系统的应用,我们细致勾勒出一幅全面的云计算安全蓝图。通过实例分析,文章揭示了安全策略在实际场景中的应用效果,并对未来云计算安全的发展趋势进行了前瞻性的预测。旨在为云计算服务提供商和用户双方提供指导,共同构筑更为坚固的网络安全防线。
|
26天前
|
机器学习/深度学习 数据采集 数据可视化
深度学习实践:构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行分类
本文详细介绍如何使用PyTorch构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行图像分类。从数据预处理、模型定义到训练过程及结果可视化,文章全面展示了深度学习项目的全流程。通过实际操作,读者可以深入了解CNN在图像分类任务中的应用,并掌握PyTorch的基本使用方法。希望本文为您的深度学习项目提供有价值的参考与启示。
|
29天前
|
安全 算法 网络安全
网络安全与信息安全:知识分享与实践
本文将深入探讨网络安全漏洞、加密技术和安全意识等方面的知识。我们将分析常见的网络攻击方式,如病毒、木马和黑客攻击,并介绍如何通过防火墙、入侵检测系统等技术手段来防止这些攻击。同时,我们还将讨论密码学在保护数据安全中的重要性,包括对称加密、非对称加密和哈希函数等概念。最后,我们将强调提高个人和组织的安全意识的重要性,包括定期更新软件、使用强密码和多因素认证等措施。
下一篇
无影云桌面