MaxCompute 持续定义 SaaS 模式云数据仓库— 云数据仓库+ Severless | 学习笔记

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
函数计算FC,每月15万CU 3个月
简介: 快速学习 MaxCompute 持续定义 SaaS 模式云数据仓库— 云数据仓库+ Severless

开发者学堂课程【SaaS  模式云数据仓库系列课程 —— 2021数仓必修课MaxCompute  持续定义  SaaS  模式云数据仓库— 云数据仓库+ Severless】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/55/detail/1028


MaxCompute 持续定义SaaS模式云数据仓库— 云数据仓库+Severless


内容介绍:

  1. MaxCompute  的  Severless  架构及特点
  2. Serverless  的数据接入服务
  3. Serverless  的多计算环境
  4. Serverless  的存储服务
  5. Serverless  的管理
  6. 按量+独占的混合售卖规格
  7. 大数据计算对计算资源的需求特点
  8. 借助固定资源池,在财务可预测的前提下,满    足不同业务、不同组织需求
  9. 成本与业务敏捷性融合
  10. 容量规划:按量付费转预付费资源需求评估
  11. 最佳实践-总结


1.MaxCompute  的  Severless  架构及特点

image.png

二、Serverless  的数据接入服务

  1. Tunnel  批量、流式导入,转换为MC列存格式、自动伸缩、免费
  2. OSS  导入/导出命令:LOAD/UNLOAD、免费


三、Serverless  的多计算环境

  1. Servlerss  计算资源池:大规模资源池,On-demand  按需提供,按作业付费
  2. 独占计算资源:支持包年包月付费、Workload  管理(负载隔离、优先级、分时伸缩、)
  3. 运行环境(runtime)支持ETL/OLAP/ML等大数据分析使用场景


四、Serverless   的存储服务

  1. 与计算无关,独立伸缩,GB->EB级
  2. 按实际存储大小付费
  3. 无需指定,默认面向分析优化(列存、压缩)
  4. 支持分区/分桶/Zorder等优化手段


五、Serverless  的管理

  1. 内建完整的管理能力,以api/sdk/web-console管理
  2. 平台侧无需用户运维



六、按量+独占的混合售卖规格

包年包月:订单计费模式为混合模式,计算资源是按包年包月进行预付费,存储 和下载则为使用之后再按量计费

按量计费:整个订单计费模式都为使用之后再按量计费,包括计算、存储


七、大数据计算对计算资源的需求特点

  • 业务敏捷性需求
  1. 长期处于成长期,处理能力能满足业务自然增长的需要,特别是业务快速变化的阶段
  2. 可以是企业的初期,也可以是创新部门的创业业务
  • 周期性峰谷差异明显
  1. 每天、每月周期性的峰谷波动巨大,以峰值容量规划,成本和SLA难以平衡
  2. 常规算力+弹性算力,根据调度/人为指定作业资源策略
  • 稳定的业务关注关键任务的按SLA产出
  1. 基线作业,与非关键作业的SLA需求不同,基线产出时间需要保障
  2. 非关键作业尽可能低成本处理,同时不影响关键作业
  • 资源治理:算力需求由快速变化转变为稳定可预期
  1. 对  CU  的容量规划,相互转换及测算
  2. 固定资源的精细化的Workload管理

追求的目标:在满足现实中的差异化需求的前提下,最小化成本


八、借助固定资源池,在财务可预测的前提下,满足不同业务、不同组织需求

  1. 负载隔离,避免互相争夺,优先关键项目与组织
  2. 作业优先级:保障关键动态作业链路查出
  3. 分时伸缩:设置白天、夜间资源分配策略,最大利用化


九、成本与业务敏捷性融合

image.png

1.按量付费  Project  :发起的作业使用  Serverless  资源-切换  Project  绑定的资源组

2.使用人员主动设定:根据需要临时指定


十、容量规划:按量付费转预付费资源需求评估

image.png

——基于  information schema  按天统计近期项目作业消耗的计算单元(算力单位:cu时)

select to_char(end_time,' yyyy-mm-dd')

stat_day,sum(cost_cpu)/100/3600 cu_hours

from information schema. tasks history

where ds > = '20200710' and task_ schema in( 'lightning')

——基于  information schema  按天统计近期项目作业消耗最高的一天,计算每个小时的算力需求(算力单位:cu时)

select to_char(end_time,' yyyy-mm-dd hh')

stathour,sum(cost_cpu)/100/3600 cu_hours

from information schema. tasks history

where ds=' 20200713' and task_schema in (' lightning')

group by to_char (end_ time,' yyyy- mm- dd hh '):



十一、最佳实践-总结

  1. 按量付费:业务快速发展及变化阶段,配合  cost control   管理
  2. 预付费:通过  quota  管理,切分多个计算资源,做负载隔离、分时管理、利用  dw+mc  基线作业优先级保障关键作业  SLA
  3. 预付费固定资源+弹性按量付费组合,作业级别选择不同计算资源:
  4. 突发使用按量付费补充突发算力需求
  5. 周期性资源尖峰需求,通过按量付费满足
  6. 容量规划:元数据、算力需求评估,资源消耗分析与优化
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
供应链 JavaScript 前端开发
Java基于SaaS模式多租户ERP系统源码
ERP,全称 Enterprise Resource Planning 即企业资源计划。是一种集成化的管理软件系统,它通过信息技术手段,将企业的各个业务流程和资源管理进行整合,以提高企业的运营效率和管理水平,它是一种先进的企业管理理念和信息化管理系统。 适用于小微企业的 SaaS模式多租户ERP管理系统, 采用最新的技术栈开发, 让企业简单上云。专注于小微企业的应用需求,如企业基本的进销存、询价,报价, 采购、销售、MRP生产制造、品质管理、仓库库存管理、财务应收付款, OA办公单据、CRM等。
337 23
|
7月前
|
运维 供应链 前端开发
中小医院云HIS系统源码,系统融合HIS与EMR功能,采用B/S架构与SaaS模式,快速交付并简化运维
这是一套专为中小医院和乡镇卫生院设计的云HIS系统源码,基于云端部署,采用B/S架构与SaaS模式,快速交付并简化运维。系统融合HIS与EMR功能,涵盖门诊挂号、预约管理、一体化电子病历、医生护士工作站、收费财务、药品进销存及统计分析等模块。技术栈包括前端Angular+Nginx,后端Java+Spring系列框架,数据库使用MySQL+MyCat。该系统实现患者管理、医嘱处理、费用结算、药品管控等核心业务全流程数字化,助力医疗机构提升效率和服务质量。
391 4
|
8月前
|
存储 人工智能 分布式计算
阿里云云数据仓库:助力企业构建智能数据基石的云端利器 。阿里云云数据仓库优势与选型指南
阿里云数据仓库体系基于MaxCompute、AnalyticDB等核心产品,提供弹性敏捷的PB级数据处理能力,支持实时分析与智能决策。其六大优势包括无限弹性伸缩、极致性能表现、智能成本优化、全栈安全体系、生态无缝对接和AI增强分析,助力企业在数字经济时代应对数据爆发式增长的挑战。灵活透明的定价体系和行业实践案例展示了其在证券、新零售、物联网等领域的成功应用,为企业构建智能数据基座提供了清晰路径。
337 6
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。
|
Oracle 安全 关系型数据库
ERP系统的云计算与SaaS模式:实现高效灵活的企业管理
【7月更文挑战第29天】 ERP系统的云计算与SaaS模式:实现高效灵活的企业管理
636 4
|
消息中间件 缓存 Java
【Java】全套云HIS(医院信息管理系统)可对接医保 采用云端SaaS模式部署
总体框架: SaaS应用,全浏览器访问 前后端分离,多服务协同 服务可拆分,功能易扩展
411 1
【Java】全套云HIS(医院信息管理系统)可对接医保 采用云端SaaS模式部署
|
传感器 人工智能 前端开发
JAVA语言VUE2+Spring boot+MySQL开发的智慧校园系统源码(电子班牌可人脸识别)Saas 模式
智慧校园电子班牌,坐落于班级的门口,适合于各类型学校的场景应用,班级学校日常内容更新可由班级自行管理,也可由学校统一管理。让我们一起看看,电子班牌有哪些功能呢?
702 4
JAVA语言VUE2+Spring boot+MySQL开发的智慧校园系统源码(电子班牌可人脸识别)Saas 模式
|
SQL 数据挖掘 数据处理
“惊!云数据仓库ADB竟能这样玩?UPDATE语句单表、多表关联更新,一键解锁数据处理新境界!”
【8月更文挑战第7天】云数据仓库ADB提供高性能数据分析服务,支持丰富的SQL功能,包括关键的UPDATE语句。UPDATE可用于单表更新,如简单地增加员工薪资;亦支持多表关联更新,实现复杂数据关系处理。例如,结合departments表更新sales部门员工薪资。使用时需确保关联条件准确,考虑事务管理保证数据一致性,并优化性能以提升大规模更新效率。合理运用UPDATE增强数据仓库实用性和灵活性。
394 0
|
存储 运维 JavaScript
SaaS云HIS平台源码 采用云部署模式,部署一套可支持多家医院共同使用
通过基于SaaS模式的医院管理系统,院内的医护人员、患者可快速建立互联协同。不仅如此,通过SaaS模式提供的解决方案,医院机构可实现远程医疗,从而为不同地区的患者带来优质医疗资源,促进医疗公平。
385 5
|
人工智能 监控 数据可视化
Java智慧工地云平台源码带APP SaaS模式 支持私有化部署和云部署
智慧工地是指应用智能技术和互联网手段对施工现场进行管理和监控的一种工地管理模式。它利用传感器、监控摄像头、人工智能、大数据等技术,实现对施工现场的实时监测、数据分析和智能决策,以提高工地的安全性、效率和质量(技术架构:微服务+Java+Spring Cloud +UniApp +MySql)。
260 4