服务框架及服务治理组件——业界调研

本文涉及的产品
网络型负载均衡 NLB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介: 声明:主要内容来自公司内部 对业界的调研,不一定恰当、准确、实时。表格文字较多,APP阅读体验较差团队服务相关组件\方案通信框架监控负载均衡\路由是否开源腾讯完全自研;BG内部自治,每个BG有自己相应的解决方案,单独演进...

声明:主要内容来自公司内部 对业界的调研,不一定恰当、准确、实时。
表格文字较多,APP阅读体验较差

团队 服务相关组件\方案 通信框架 监控 负载均衡\路由 是否开源
腾讯 完全自研;BG内部自治,每个BG有自己相应的解决方案,单独演进;

包括:服务注册路由中心;流量定义ABTesting方案;日志分布式收集;
配置中心等没有公司级的服务治理组织去统一
各个BG也不一样

技术工程TEG\原搜索:自定义二进制协议编解码,或Protocol Buffer(以下简称PB)进行序列化\反序列化,自研服务容器、进程框架(e.g. Poppy – 基于PB的RPC框架)

原电商ECC:自研web container\app container,采用类PB方式auto gen业务代码骨架,通信采用二进制协议

社交SNG、游戏IEG:也都是自研组件+序列化\反序列化工具+二进制协议

QQ后台:msec(Mass Service Engine in Cluster)毫秒服务引擎,使用PB。

基础监控公司相对比较统一,使用监控平台itils,每台机器部署单独agent收集业务上报的数据。

部分BG会构建自己的业务统计监控系统
公司级组件L5(Aim to High Availabliliy 99.999%),提供系统内各层、各模块间调用的路由决策、负载均衡及容错,以agent模式部署运行

部分BG在用,主要覆盖为SNG的业务
个别开源
百度 之前使用codename为伽利略的系统,负责服务的注册路由、配置管理,基于zookeeper(以下简称zk)构建。
后来由于接口lib调用不稳定等各种问题,
大家逐渐失去信心而改用另一套自研系统BNS,也是类似zk的层次目录树结构存储组织。

没有公司级的服务治理组织去统一
主要采用ub通信框架(基础架构部提供,lbs等部门在用)
采用的协议为mcpack 一种类似json文本协议(据说内部当时争议较大),优势是可读性好,
缺点是数据交换传输量大,效率不高。

网页PS部门采用sofa-pbrpc,基于pb实现轻量级rpc服务框架:https://github.com/BaiduPS/sofa-pbrpc/wikihttps://github.com/BaiduPS/sofa-pbrpc
监控系统为noah,所有服务器都部署noah agent。 以服务接口形式提供,由业务自己去调用,没有封装在框架内,也没有以单独代理进程形式实现。 不开源,除了sofa-pbrpc
阿里巴巴 各子公司(淘宝、1688、阿里云、阿里妈妈等)在基础组件、服务治理组件方面复用不多,基本也自成体系,有各自方案。 dubbo(2008年底开始设计,2011.11开源 https://github.com/alibaba/dubbohttp://alibaba.github.io/dubbo-doc-static/User+Guide-zh.htm ) 阿里内部已放弃。不过外部有一些公司在用,如京东、人人等

现内部主要使用hsf(http://www.doc88.com/p-8866142882055.html),service定义参考了OSGi

Hsf vs dubbo:hsf是淘宝团队做的,dubbo是阿里巴巴团队做的,而2011年底时hsf每天的服务调用量是dubbo的20+倍,稳定性、成熟度、使用范围更广(http://www.iteye.com/topic/1116866?page=3 )c\c++开发主要使用arpc基于protocol buffer
N\A 封装在服务框架中,直接调用远端的服务注册\路由系统 不开源
google 整个公司使用比较统一的解决方案

Protocol buffer - 数据通信交换、存储格式,序列化\反序列化工具

BNS - Borg Name Service 名字服务,与gslb负载均衡器进行交互,获取service对应的IP:Port,服务不同权重在gslb中进行登记。

Stubby - RPC服务框架。

支持基于http的服务状态、健康状态请求访问。在框架中封装了对权限认证服务、BNS服务的接口访问,从而实现权限认证、负载均衡、路由等策略。
Borg进行集群资源管理、任务调度\监控 在框架内会做路由缓存,每次拿到m个下游服务节点进行random access。且watch服务列表或定期到BNS去刷新获取。 PB开源。其他组件系统耦合依赖太多,没有开源
amazon Amazon AWS提供了一系列比较成熟的产品组件和一致的解决方案。

Elastic beanstalk - 应用程序部署和管理服务。用户只需上传程序代码,
Elastic Beanstalk 即可自动处理从容量预配置、负载均衡、自动扩展到应用程序运行状况监控的部署。

SWF(Simple Workflow) - 工作流框架。协助构建、运行与扩展平行或序列分步的后台作业程序

针对不同的应用场景提供相应的建议解决方案,如电商架构方案http://media.amazonwebservices.com/architecturecenter/AWS_ac_ra_ecommerce_webfrontend_14.pdf

SQS(Simple Queue Service) - 快速可靠、可扩展且完全托管的消息队列服务 Amazon CloudWatch - 针对AWS云资源及应用程序进行监控的服务。可以收集和跟踪指标,收集和监控日志文件,设置警报。 通过单独部署的负载均衡设备Elastic Load Balancing,在可用区域内,自动分发请求流量到不同的EC2实例中 不开源
ebay ebay内部并没有太统一的方案,内部的很多开源方案都是使用的restfull的工具,
很多基于eclipse的开发插件,github路径:https://github.com/ebay

消息队列使用的是bes(Business Event Stream)

SOA框架是Turmeric框架:http://www.ebaytechblog.com/2011/02/17/ebay-open-sourced-its-soa-platform/#.U-LYVIAzAf4

框架比较多,目前了解到的,可能不太准确,主要有基于Turmeric的客户端方案SIF和SPF,前端同学介绍说还有一个ginger framework:http://www.gingerframework.com/ Turmeric的监控主要体现在,运行时server和Client的监控,调用监控,存储监控服务数据,查看监控等。但是内部的同学说只有”大的方面的监控“ N/A 目前还没有开源,准备开源,另外据几个同学说,目前使用的并不广泛,另外目前的版本还是有很多的rough edges
京东 自2014年初开始研发JSF(Jingdong Service Framework)。前身为SAF(Service Architecture Framework),2012年开始推动SOA,统一rpc调用框架。

SAF

JSF: 详见附件pdf

JSF vs SAF,主要改进点:

服务不再直连ZK,注册中心registry不是简单zk cluster,而是多机房分布式部署的server,所有注册信息持久化到DB中。牺牲强一致性,通过定期sync实现最终一致性。

(关于这个点,京东其实发生过几个小时大部分online服务不可用的大事故)

很多逻辑不再放到客户端,避免升级更新周期过长,难以一致的问题。

增加流控;增加丰富的调用监控、数据可视化图表等功能。

研发团队:云平台-系统技术部-服务框架组

个人介绍:

高广超:多年一线互联网研发与架构设计经验,擅长设计与落地高可用、高性能互联网架构。

本文首发在 高广超的简书博客 转载请注明!

img_7015b3c64a6b1e4a95d4739adf2bbaa0.png
image.png
相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
目录
相关文章
|
2月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
2月前
|
运维 监控 Nacos
探索微服务架构下的服务治理:动态服务管理平台的力量
探索微服务架构下的服务治理:动态服务管理平台的力量
|
3月前
|
运维 监控 Cloud Native
云原生架构下,微服务治理的艺术与实践####
【10月更文挑战第14天】 在数字化转型的大潮中,云原生技术以其高效、灵活与可扩展性成为企业IT架构的首选。本文深入探讨了云原生架构的核心理念,聚焦于微服务治理的策略与实践,揭示了如何通过精细化管理提升系统的响应速度、稳定性和可维护性。不同于传统的摘要概述,本文摘要旨在直接触及读者关注的核心——即如何在复杂多变的云环境中,实现微服务的高效协同与治理,为读者提供一个清晰的行动指南。 ####
42 1
|
6月前
|
监控 Kubernetes Cloud Native
云原生架构下的微服务治理之道
【7月更文挑战第30天】在数字化转型的浪潮中,企业级应用正迅速向云原生架构迁移。本文将深入探讨云原生环境下微服务治理的最佳实践,包括服务发现、配置管理、流量控制等关键策略,并结合实例分析如何在保障系统弹性、可维护性的同时,优化资源利用效率和加快业务创新速度。
66 2
|
6月前
|
监控 Cloud Native 安全
云原生架构下的微服务治理实践
在数字化转型的浪潮中,云原生技术以其灵活性和可扩展性成为现代软件工程的基石。本文将深入探讨云原生架构下微服务治理的实践路径,从微服务的拆分、容器化部署、服务网格的应用到最终的监控与故障排除,提供一套全面的方法论。文章旨在为读者呈现一个清晰的云原生环境下,如何高效管理和维护微服务系统的全景图。
67 2
|
6月前
|
负载均衡 Cloud Native 云计算
云原生架构下的微服务治理与挑战
随着云计算技术的不断演进,云原生架构已成为现代应用开发的首选模式。本文将深入探讨在云原生环境下,微服务治理的重要性、实现方法及所面临的挑战。通过分析微服务治理的关键要素如服务发现、配置管理、负载均衡和故障转移等,揭示如何在高度动态的云环境中保持服务的高可用性和灵活性。同时,本文也将指出在实施微服务治理过程中可能遇到的技术难题和应对策略,为构建健壮的云原生应用提供指导。
|
8月前
|
运维 Kubernetes Cloud Native
构建未来:云原生架构下的微服务治理
【4月更文挑战第30天】 在数字化转型的浪潮中,云原生技术以其灵活性、可扩展性和容错性成为企业IT战略的核心。本文深入探讨了如何通过云原生架构实现微服务的高效治理,包括服务发现、配置管理、流量控制和故障处理等关键方面。我们将展示一系列最佳实践和工具选择,以帮助企业构建一个既可靠又灵活的服务网格,确保业务连续性并加速创新步伐。
|
8月前
|
设计模式 运维 微服务
探索微服务架构下的服务治理与调优实践
【2月更文挑战第15天】 在当前软件开发领域,微服务架构已成为一种流行的设计模式,其通过拆分传统单体应用为一系列小型、自治的服务来提高系统的可维护性和扩展性。然而,随着服务数量的增加,如何有效管理和调优这些服务成为了开发和运维团队面临的挑战。本文将深入探讨在微服务架构下,如何实施服务治理以及调优策略,旨在为读者提供一套实用的技术方案和经验分享。
50 1
|
运维 资源调度 Kubernetes
服务治理之 关于服务治理的个人看法
在软件`开发`、`维护`过程中。软件的生命力总是从最初的`理想`状态,逐步趋向于`复杂`、`混乱`和`无序状态`发展,软件将会进入`寂静`状态(谁也不敢动),再到软件`不可维护`而被迫`下线`或`重构`。 这种损坏软件质量的因素的逐步增长,叫做软件的`熵增现象`。
|
架构师 安全 Cloud Native
OpenSergo 正式开源,多家厂商共建微服务治理规范和实现
OpenSergo,Open 是开放的意思,Sergo 则是取了服务治理两个英文单词 Service Governance 的前部分字母 Ser 和 Go,合起来即是一个开放的服务治理项目。 该项目由阿里云、bilibili、字节跳动,以及 Spring Cloud Alibaba、Nacos、Apache Dubbo 社区共同维护,旨在构建一个和语言无关、和技术形态无关,但贴近业务的统一服务治理规范和实现,欢迎大家加入共建。
2286 1
OpenSergo 正式开源,多家厂商共建微服务治理规范和实现