明晚九点|一线互联网公司服务器监控系统架构分享

简介:

主题:一线互联网公司服务器监控系统架构

内容:

  • 自动运维的一点体会
  • 性能与可用性可扩展
  • 功能可扩展
  • 监控支撑业务扩展

主讲师:PC 老师

大学时期就负责学校官方网站的运维工作,实习期间加入豆瓣,有幸成为豆瓣 Top20 员工,从事 Python 开发及运维工作,后在 BAT 从事自动化运维,见证BAT 运维自动化从无到有。擅长系统底层、分布式系统开发,热衷于开源运动,给 memcached、SETI@Home 等多个开源项目贡献过代码。

自动化运维的一点体会

不同公司的需求差异

  • 监控?
  • 配置管理?
  • 自动部署?
  • 调度系统?
  • Iaas / Paas?
  • or more?

不同规模、不同行业的公司存在需求差异

自动运维的几个基础

  • 一本清晰的账本 (准确的基础信息)
  • 一个靠谱的监控
  • 一个靠谱的任务执行系统

    自动运维的基础

    明晚九点|一线互联网公司服务器监控系统架构分享

靠谱的监控

  • 本质:对被监控对象的指标进行状态判定
    一台服务器上 nginx 服务的连接数
  • 需要支持网络层、服务器、服务、业务四层
  • 精准智能
  • 适应机器 的规模与增长速度
  • 高效、高可用性
  • 支持纷繁多样的服务
    明晚九点|一线互联网公司服务器监控系统架构分享

明晚九点|一线互联网公司服务器监控系统架构分享

性能与可扩展

模块内性能

  • 通信
    长连接
    Epoll
  • 多进程/线程
    高并发
    并发度可调
    明晚九点|一线互联网公司服务器监控系统架构分享

    通信层剥离

  • 统一的高性能通信框架与通信协议
  • 业务开发简单清晰

    多进程工作模型

  • 单进程IO复用接收
  • 多进程(worker)并发处理
    明晚九点|一线互联网公司服务器监控系统架构分享

模块功能精简,便于组合

横向扩展

  • 任意环节支持横向扩展
  • 无状态、负载均衡
  • 可支持级联

    整体处理性能线性增长

  • 多路多点部署

高可用

去中心化

  • 无单点
  • 负载均衡
  • 横向扩展
  • 多点部署
  • 自动切换
  • 每个环节自动切换
  • WRR
  • 多路冗余
  • 无状态
  • Supervise保证存活
    明晚九点|一线互联网公司服务器监控系统架构分享

    数据传输可靠性

  • 传输过程中多次确认
    采集到汇聚
    转发到逻辑判断
    转发到存储
  • 外部状态监控
    传输起始端健康检查
    每个环节的外部监控
  • 内部判断

模块内扩展

明晚九点|一线互联网公司服务器监控系统架构分享

模块间可扩展

  • 采集
  • 汇聚转发
  • 过滤
  • 报警
  • 离线存储
  • 挖掘分析
  • 展示

模块间可扩展性

明晚九点|一线互联网公司服务器监控系统架构分享

七巧板搭配

  • 汇聚后的多路传输
  • 级联

    功能扩展简单

  • 存活监控
  • 端口监控
  • 集群

    核心模块高度复用

  • 模块之间联动反馈
  • 互联互通
  • 存活监控

    模块之间联动反馈

  • 互联互通
  • 存活监控

    功能扩展

明晚九点|一线互联网公司服务器监控系统架构分享

  • 基础监控 => 自定义监控
  • 端口 =>语义监控
  • URL监控 => HTTP语义监控
  • URL监控 => 访问质量监控
  • 服务器指标监控 => 集群指标监控

监控支撑业务扩展

预算与成本分摊 ---offline

  • 结合基础信息管理
  • 资源使用与服务器选型

    资源管理 --- offline

  • 空闲资源挖掘
  • 资源统计分析与基础信息校正
  • 容量管理

    空闲资源利用 --- offline

  • 存储资源
  • 计算资源

    调度决策的基础 --- online

  • 报警触发简单任务执行
  • 关联报警挖掘
  • 与业务评估模型结合

自动运维平台的一个架构简图

明晚九点|一线互联网公司服务器监控系统架构分享

详情:http://mp.weixin.qq.com/s/THG8WJeLWR3U47BoDLGlWg


本文转自 xjtuhit 51CTO博客,原文链接:http://blog.51cto.com/51reboot/2059459


相关文章
|
24天前
|
存储 负载均衡 网络协议
杨老师课堂之JavaWeb项目架构之NFS文件服务器
杨老师课堂之JavaWeb项目架构之NFS文件服务器
25 0
|
4天前
|
存储 关系型数据库 数据库
给阿里云的建议和意见 一个云服务器架构是否可行
摘要(Markdown格式): 在修复阿里云服务器IPv4设置错误时遇到困难,导致服务器远程登录失败及外网访问受阻,耗时三天解决。建议阿里云更新文档,确保设置指导与实际情况一致,例如只需在路由表添加条目关联IPv4。此外,建议优化帮助页面,如采用折叠式设计减少干扰。服务器主要任务是数据分析、存储和分发,文中提出简化服务器框架,消除硬件软件复杂配置,利于初学者和独立开发者快速上手,降低时间成本。该设计旨在减少无用组件,节省资源,同时降低云服务商的人力和支持成本。期望云服务商考虑此类架构创新。目前未知是否有类似产品,期待业界反馈。
211 0
给阿里云的建议和意见 一个云服务器架构是否可行
|
11天前
|
弹性计算 运维 Kubernetes
阿里云ECS与混合云策略的结合,不仅为企业搭建了一个既灵活又稳定的IT基础架构,还为业务的快速发展与创新提供了坚实的技术支撑。
【7月更文挑战第3天】阿里云ECS在混合云中扮演关键角色,提供弹性计算资源和多样计费模式,确保业务连续性与灵活性。通过VPC互通、应用迁移、数据同步服务,如VPC对等连接、DTS,实现云上云下资源的高效整合。结合安全解决方案,保证在混合环境下的合规与安全。阿里云ECS助力企业数字化转型,应对市场变化。
49 1
|
14天前
|
运维 Cloud Native 云计算
云原生架构的演进:从微服务到无服务器计算
【6月更文挑战第30天】 在数字化转型和技术创新的浪潮中,云原生技术以其灵活性、可扩展性和成本效益成为企业IT战略的核心。本文将探索云原生架构的关键概念,从早期的微服务架构到现代的无服务器计算模型,揭示这一演变如何推动企业更高效地开发、部署和管理应用程序。我们将深入讨论这些技术背后的原理,以及它们如何帮助企业实现敏捷性、弹性和自动化运维。
|
23天前
|
分布式计算 资源调度 Hadoop
分布式系统详解--架构(Hadoop-克隆服务器)
分布式系统详解--架构(Hadoop-克隆服务器)
26 1
|
5天前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
|
9天前
|
前端开发 Java 应用服务中间件
C/S和B/S架构以及Web服务器
C/S和B/S架构以及Web服务器
15 0
|
10天前
|
负载均衡 Java Linux
黑马头条01,环境搭建,今日头条的介绍,今日头条的功能架构图,技术栈的说明,服务层,nacos(奶靠丝)安装,安装在Linux服务器上环境准备,
黑马头条01,环境搭建,今日头条的介绍,今日头条的功能架构图,技术栈的说明,服务层,nacos(奶靠丝)安装,安装在Linux服务器上环境准备,
|
15天前
|
Cloud Native 安全 开发者
云原生架构的演进与实践:从微服务到无服务器计算
本文深入探讨了云原生技术的最新进展,特别关注微服务和无服务器计算模型。通过分析相关研究数据和行业案例,文章揭示了云原生架构如何推动现代应用开发,提升运维效率,并实现资源的最优化配置。文中详细讨论了云原生生态系统中的关键组成部分,包括容器化、自动化管理工具和服务网格,以及它们如何共同促进敏捷性和可扩展性。此外,文章还分析了云原生安全策略的重要性,以及如何在保障安全的同时,保持系统的灵活性和高效性。
|
16天前
|
网络协议 安全 分布式数据库
技术分享:分布式数据库DNS服务器的架构思路
技术分享:分布式数据库DNS服务器的架构思路
19 0