集群规模及购买服务器建议|学习笔记

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习 集群规模及购买服务器建议

开发者学堂课程【阿里云离线数仓实战 1:项目介绍及架构设计:集群规模及购买服务器建议】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/102/detail/1792


集群规模及购买服务器建议


内容简介:

一、集群规模的选择

二、购买服务器建议

 

一、集群规模的选择

服务器的选型,比如:决定买阿里云云主机,那么接下来面临的问题则是应该买多少云主机。这本质上取决于你的数据量,数据量越大,买的云主机就越多,数据量越少,买的云主机就越少。那么应该怎样去计算数据量,则包括下列几项:(用户行为数据、DataHub 中数据、业务数据比较主要)

用户行为数据:

(1)每天日活跃用户 100 万,每人一天平均 100 条: 100万*100万=10000万条(如果每天日活跃用户是 100 万的网站,那么每人一天 100 万埋点日志,即埋点日志指记录用户来到网站的行为,看了哪些页面、浏览了哪些商品、点击了哪些商品详情、支付了哪些订单等,这些用户行为的记录初步评估 100 条。这 100 条并不是非常绝对。在项目初期,埋点数据量会相对较少。随着企业的发展,分析的指标越来越多,那么埋点记录的数据就会越多,那就可能会大于 100 条,不同阶段的数据量不同,假如 100 万个日活,一天有 100 万个用户访问了网站,每个人产生 100 条数据,则大概是 10000 万条,相当于一亿条。)

(2)每条日志 1K 左右,每天1 亿条: 100000000/1024/ 1024 =约 100 G(通常情况下,一亿条埋点日志大概是1K左右,而在公司中开发 0.5K~2K 之间是一个标准日志。那么是 2k 还是 0.5,则取决于埋点的志段多少,同时志段里面包含信息的多少,就决定了它的大小。)

(3)数仓 ODS 层采用 LZO+ parquet 存储: 100g 压缩为 10g 左右

(4)数仓 DWD 层采用 LZO+ parquet 存储: 10g 左右

(5)数仓 DWS 层轻度聚合存储(为了快速运算,不压缩,压缩会影响计算效率) : 50g 左右

(6)数仓 ADS 层数据量很小:忽略不计

(7)保存 3 副本: 70g*3=210g

(8)半年内不扩容服务器来算: 210g*180天=约37T

(9)预留 20%- 30%Buf=37T/0.7=53T

DataHub 中数据

(1)每天约 100G 数据'副本(2) =200g

(2)保存 3 天*200g=600g

(3 )预留 30%buf=600g/0.7= 857g=约1 T

Flume 中默认缓存的数据比较小:暂时忽略不计

业务数据

(1) 每天活跃用户 100 万,每天下单的用户 10 万,每人每天产生的业务数据10条,每条日志1k左右: 10万*10条*1k=1g 左右

(2) 数仓四层存储: 1g*3=3g

(3) 保存3副本: 3g*3=9g

(4) 半年内不扩容服务器来算: 9g*180天=约1.6T

(5) 预留 20%-~30%Buf=1.6T/0.7=2T

集群总规模: 53T+1T+2T=56T

算到这:约 8T*7台服务器(128G 内存、8T 磁盘、CPU 和线程)

 

二、购买服务器建议

图片52.png

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
1月前
|
SQL 机器学习/深度学习 分布式计算
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
62 1
|
10天前
|
弹性计算 安全 网络安全
阿里云服务器四种常见购买方式适用对象与购买流程参考
阿里云服务器有多种购买方式,不同的方式适合对象与购买流程不一样,常见的购买方式有自定义购买、一键购买、云市场购买和通过活动购买四种方式。本文为大家介绍这四种方式的区别、适合对象以及详细的流程,以供参考和选择。
|
1月前
|
弹性计算 开发框架 .NET
阿里云服务器购买教程及云服务器地域、实例、操作系统、带宽等参数选择指南
对于初次购买阿里云服务器的用户来说,想使用阿里云服务器搭建网站或者运行APP、小程序等项目,第一步就是要先购买阿里云服务器,下面小编以图文形式给大家介绍一下阿里云服务器的购买流程,以及购买过程中如何云服务器地域、实例、带宽等关键配置和选择这些参数的一些注意事项,以供参考。
|
1月前
|
域名解析 网络协议 CDN
阿里云服务器购买后如何解析域名,三步操作即可解析绑定
阿里云服务器购买后如何解析域名,三步操作即可解析绑定
|
1月前
|
SQL 分布式计算 NoSQL
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
41 4
|
1月前
阿里云国际版购买了服务器后如何下载发票?
阿里云国际版购买了服务器后如何下载发票?
|
1月前
|
Kubernetes 应用服务中间件 nginx
搭建Kubernetes v1.31.1服务器集群,采用Calico网络技术
在阿里云服务器上部署k8s集群,一、3台k8s服务器,1个Master节点,2个工作节点,采用Calico网络技术。二、部署nginx服务到k8s集群,并验证nginx服务运行状态。
592 1
|
1月前
|
存储 网络协议 Linux
AWS实操-EC2-创建购买linux(centos)EC2服务器
AWS实操-EC2-创建购买linux(centos)EC2服务器
|
1月前
|
安全 网络协议 网络安全
如何购买阿里云购买DDoS高防服务器?
如何购买阿里云购买DDoS高防服务器?
|
7天前
|
人工智能 弹性计算 编解码
阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考
GPU云服务器作为阿里云提供的一种高性能计算服务,通过结合GPU与CPU的计算能力,为用户在人工智能、高性能计算等领域提供了强大的支持。其具备覆盖范围广、超强计算能力、网络性能出色等优势,且计费方式灵活多样,能够满足不同用户的需求。目前用户购买阿里云gpu云服务器gn5 规格族(P100-16G)、gn6i 规格族(T4-16G)、gn6v 规格族(V100-16G)有优惠,本文为大家详细介绍阿里云gpu云服务器的相关性能及收费标准与最新活动价格情况,以供参考和选择。
下一篇
无影云桌面