集群规模及购买服务器建议|学习笔记

简介: 快速学习 集群规模及购买服务器建议

开发者学堂课程【阿里云离线数仓实战 1:项目介绍及架构设计:集群规模及购买服务器建议】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/102/detail/1792


集群规模及购买服务器建议


内容简介:

一、集群规模的选择

二、购买服务器建议

 

一、集群规模的选择

服务器的选型,比如:决定买阿里云云主机,那么接下来面临的问题则是应该买多少云主机。这本质上取决于你的数据量,数据量越大,买的云主机就越多,数据量越少,买的云主机就越少。那么应该怎样去计算数据量,则包括下列几项:(用户行为数据、DataHub 中数据、业务数据比较主要)

用户行为数据:

(1)每天日活跃用户 100 万,每人一天平均 100 条: 100万*100万=10000万条(如果每天日活跃用户是 100 万的网站,那么每人一天 100 万埋点日志,即埋点日志指记录用户来到网站的行为,看了哪些页面、浏览了哪些商品、点击了哪些商品详情、支付了哪些订单等,这些用户行为的记录初步评估 100 条。这 100 条并不是非常绝对。在项目初期,埋点数据量会相对较少。随着企业的发展,分析的指标越来越多,那么埋点记录的数据就会越多,那就可能会大于 100 条,不同阶段的数据量不同,假如 100 万个日活,一天有 100 万个用户访问了网站,每个人产生 100 条数据,则大概是 10000 万条,相当于一亿条。)

(2)每条日志 1K 左右,每天1 亿条: 100000000/1024/ 1024 =约 100 G(通常情况下,一亿条埋点日志大概是1K左右,而在公司中开发 0.5K~2K 之间是一个标准日志。那么是 2k 还是 0.5,则取决于埋点的志段多少,同时志段里面包含信息的多少,就决定了它的大小。)

(3)数仓 ODS 层采用 LZO+ parquet 存储: 100g 压缩为 10g 左右

(4)数仓 DWD 层采用 LZO+ parquet 存储: 10g 左右

(5)数仓 DWS 层轻度聚合存储(为了快速运算,不压缩,压缩会影响计算效率) : 50g 左右

(6)数仓 ADS 层数据量很小:忽略不计

(7)保存 3 副本: 70g*3=210g

(8)半年内不扩容服务器来算: 210g*180天=约37T

(9)预留 20%- 30%Buf=37T/0.7=53T

DataHub 中数据

(1)每天约 100G 数据'副本(2) =200g

(2)保存 3 天*200g=600g

(3 )预留 30%buf=600g/0.7= 857g=约1 T

Flume 中默认缓存的数据比较小:暂时忽略不计

业务数据

(1) 每天活跃用户 100 万,每天下单的用户 10 万,每人每天产生的业务数据10条,每条日志1k左右: 10万*10条*1k=1g 左右

(2) 数仓四层存储: 1g*3=3g

(3) 保存3副本: 3g*3=9g

(4) 半年内不扩容服务器来算: 9g*180天=约1.6T

(5) 预留 20%-~30%Buf=1.6T/0.7=2T

集群总规模: 53T+1T+2T=56T

算到这:约 8T*7台服务器(128G 内存、8T 磁盘、CPU 和线程)

 

二、购买服务器建议

图片52.png

相关实践学习
数据库实验室挑战任务-初级任务
本场景介绍如何开通属于你的免费云数据库,在RDS-MySQL中完成对学生成绩的详情查询,执行指定类型SQL。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
27天前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
1月前
|
存储 编解码 缓存
购买阿里云服务器如何选择实例?根据业务场景与细分场景选择实例规格
对于很多初次购买阿里云服务器的用户来说,面对众多可选择的云服务器实例规格,往往不知道如何选择,不同实例规格适用于不同的业务场景,本文为大家汇总了不同业务场景和细分场景下应该选择的主要实例规格,以及这些实例规格的主要性能和适用场景,如果你不知道如何选择阿里云服务器的实例规格,不妨根据自己的场景参考本文所推荐的主要实例规格来选择。
购买阿里云服务器如何选择实例?根据业务场景与细分场景选择实例规格
|
26天前
|
存储 弹性计算 安全
阿里云活动内云服务器没有数据盘怎么办?购买后如何购买并挂载云盘?
在我们通过阿里云的活动来购买云服务器的时候,一般默认情况下只有系统盘,是没有数据盘的,但是很多用户处于实际使用需求和安全等方面的需求,通常都需要在购买之后单独再购买一块云盘作为数据盘挂载到云服务器上,本文以图文形式为大家展示阿里云活动内云服务器购买流程以及购买后如何购买并挂载云盘,适合新手用户参考。
阿里云活动内云服务器没有数据盘怎么办?购买后如何购买并挂载云盘?
|
28天前
|
弹性计算
2024阿里云服务器购买、续费、升级配置价格表新鲜出炉!
2024年阿里云服务器购买、续费、升级优惠政策整理,阿里云服务器优惠价格表:轻量2核2G3M服务器61元一年、2核4G4M带宽165元1年,云服务器4核16G10M带宽26元1个月、149元半年,阿里云ECS云服务器2核2G3M新老用户均可99元一年续费不涨价,企业用户2核4G5M带宽199元一年。
386 2
|
1月前
|
消息中间件 存储 Kafka
Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
【2月更文挑战第19天】Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
140 1
|
1月前
|
弹性计算 大数据 测试技术
阿里云服务器哪个好用便宜?2024年阿里云便宜购买配置价格整理总结
随着云计算技术的日益成熟,云服务器已成为企业和个人用户的首选。在众多的云服务提供商中,阿里云和腾讯云以其稳定的服务、强大的性能和优惠的价格赢得了广大用户的青睐。阿里云推出的多款云服务器实例中,2核2G3M轻量应用服务器一年仅需62元,而经济型e实例云服务器ECS和通用算力型u1实例云服务器ECS则提供了更广泛的选择。其中,2核2G3M经济型e实例一年99元,2核4G通用算力型u1实例一年706.25元,更有4核8G、4核16G等高性能配置供用户选择。这些实例在性价比上表现突出,尤其是通用算力型u1实例,性能与价格俱佳。对于性能要求不高的用户来说,它是非常合适的选择;而对性能有更高要求的用户。
|
1月前
|
弹性计算 大数据 测试技术
阿里云云服务器便宜购买多少钱?2024年阿里云服务器优惠购买价格出炉!
随着云计算技术的飞速发展,云服务器已成为企业和个人不可或缺的基础设施。在众多的云服务提供商中,腾讯云和阿里云以其稳定的服务、强大的技术支持及丰富的产品线而备受用户青睐。2024年阿里云提供了多样化的产品选择。从2核2G3M轻量应用服务器一年62元,到适用于各种规模应用的通用算力型u1实例云服务器ECS,阿里云为用户提供了全方位的服务支持。值得一提的是,阿里云的经济型e实例云服务器ECS同样在价格和性能上取得了很好的平衡,适用于不同阶段的用户需求。
46 0
|
1月前
|
存储 弹性计算 人工智能
阿里云老用户可以购买99元服务器,2核2G3M固定带宽,你说牛不牛?
阿里云老用户可以购买99元服务器,2核2G3M固定带宽,你说牛不牛?阿里云服务器99元一年配置为云服务器ECS经济型e实例,2核2G配置、3M固定带宽和40G ESSD Entry系统盘,新用户和老用户均可买,续费不涨价,续费也是99元一年。
|
1月前
|
网络协议 关系型数据库 PHP
如何使用Cloudreve搭建私有云盘并发布公网访问无需购买域名服务器
如何使用Cloudreve搭建私有云盘并发布公网访问无需购买域名服务器
|
2月前
阿里云哪个活动中的云服务器支持2年或5年购买时长?优惠价格是多少?
2024年阿里云活动中的云服务器可以购买2年或5年吗?目前除了轻量应用服务器之外,其他系列的云服务器都是支持选择2年或5年购买时长的。本文为大家介绍下阿里云活动云服务器2年或5年的具体优惠价格。
阿里云哪个活动中的云服务器支持2年或5年购买时长?优惠价格是多少?

热门文章

最新文章