大数据平台开发规范示例2

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 大数据平台开发规范示例2

四、开发流程

包括开发、测试和上线流程。

4.1 开发

  • 如果有概要或详细方案设计(流程图),需严格遵循
  • 按排期进行开发,每周或隔天进行进度反馈,避免信息差
  • 对于公共工具类和api,可建立私有maven仓库进行统一管理
  • 开发完的程序无法通过测试,则需要即刻进行返工重新发起后续流程

4.2 Code Review

  • 随着时间推移,组件改造、脚本或api等开发代码量会越来越多,代码review需重视
  • 促进团队技术氛围
  • 提升代码质量及统一规范
  • 避免’当局者迷’和’重复造轮’现象
  • cr环节需要耗费一定的时间,故排期时需要包含cr的时间

4.3 测试

  • 需输出相应的测试用例,包含但不限于自测、联调、场景验证和读写压测等
  • 用例形式不限,可通过列表、123陈述、流程图或思维导图的形式输出

4.4 上线

  • 上线流程需遵循【运维规范
  • 涉及组件内容变更(bug修复、参数调整、组件升级和重启等)需提前发出公告

4.4.1 升级公告示例

[喇叭][喇叭]【Doris Be2.0升级通知】
@人员 
变更时间:2023-08-08 12:12 至 2023-08-08 13:13
变更类型:BE滚动升级
变更版本:1.2.6-release升级至2.0-roc3
变更内容:仅升级BE
变更原因:
1. 引入workgroup和倒排索引等2.0新特性
2. 使用新优化器提升整体查询效率
3. ......
测验结果:升级前测试报告
回滚策略:无
预计影响范围:doris上游任务可能会存在闪断

4.4.2 调优公告示例

[喇叭][喇叭]【Dolphinscheduler调优通知】
@人员 
变更时间:2023-08-08 13:13 至 2023-08-08 14:14
变更类型:调优重启
变更内容:
1. datasource调整为druid
2. 默认连接大小由50调整为100
3. 新增ldap模块,ds登录改为sso账号密码登录
预计影响范围:所有ds调度任务(重启后自动重试)

4.4.3 重启公告示例

[喇叭][喇叭]【Doris Be紧急重启通知】
@人员 
变更时间:2023-08-08 00:00 至 2023-08-08 01:01
变更类型:重启
变更内容:无
变更原因:进程假死
预计影响范围:doris上游任务可能会存在闪断

4.4.4 完成公告示例

【XXX完成通知】
完成时间:2023-08-08 08:08
完成结果:升级完成/调优完成/重启完成
完成说明:顺风顺水顺财神

五、开发规范

5.1 数据库

拒绝select *

所有表都需要添加注释

临时库/表名必须以tmp_工号为前缀

根据需求取舍选择范式或反范式设计

库名、表名和字段名禁止使用保留字段

库名、表名和字段名必须使用小写字母,并采用下划线分割

5.2 JAVA

详细可参考阿里Java编码规范 。

5.2.1 命名

类名使用UpperCamelCase风格,但以下情形例外:DO / BO / DTO / VO / AO / PO等

常量命名全部大写,单词间用下划线隔开,力求语义表达完整清楚,不要嫌名字长

方法名、参数名、成员变量、局部变量都统一使用lowerCamelCase风格,必须遵从驼峰形式

5.2.2 常量

不允许任何魔法值 ( 即未经定义的常量 ) 直接出现在代码中

long 或者 Long 初始赋值时,使用大写的 L ,不能是小写的 l ,小写容易跟数字 1 混淆,造成误解

5.2.3 注释

谨慎注释掉代码;在上方详细说明,而不是简单地注释掉;如果无用,则删除

类、类属性、类方法的注释必须使用 Javadoc 规范,使用/*内容/格式,不得使用 // xxx 方式

5.3 Git策略

5.4 Code Review

  • 测试前需进行cr,或者同步进行
  • 对每次的merge request都进行cr,即mr即cr,避免mr堆积
  • cr时可先输出代码的主流程图,事半功倍
  • 小需求私下review
  • 可2~3人到电脑旁review
  • 先讲需求再review
  • 核心流程会议review
  • 主要review流程,让参会人员都熟悉流程
  • 其次再review核心代码以及配置相关的内容

大数据平台开发规范示例至此结束,查阅过程中若遇到问题欢迎留言交流

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
SQL 分布式计算 大数据
大数据计算MaxCompute怎么查看示例的id呢?
大数据计算MaxCompute怎么查看示例的id呢?
81 0
|
2月前
|
消息中间件 分布式计算 大数据
大数据-121 - Flink Time Watermark 详解 附带示例详解
大数据-121 - Flink Time Watermark 详解 附带示例详解
86 0
|
3月前
|
机器学习/深度学习 数据可视化 大数据
阿里云大数据的应用示例
阿里云大数据应用平台为企业提供高效数据处理与业务洞察工具,涵盖Quick BI、DataV及PAI等核心产品。DT203课程通过实践教学,帮助学员掌握数据可视化、报表设计及机器学习分析技能,提升数据驱动决策能力。Quick BI简化复杂数据分析,DataV打造震撼可视化大屏,PAI支持全面的数据挖掘与算法应用。课程面向CSP、ISV及数据工程师等专业人士,为期两天,结合面授与实验,助力企业加速数字化转型。完成课程后,学员将熟练使用阿里云工具进行数据处理与分析。[了解更多](https://edu.aliyun.com/training/DT203)
|
5月前
|
分布式计算 运维 大数据
MaxCompute产品使用合集之如何查看示例的id
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
75 8
|
7月前
|
存储 数据挖掘 大数据
大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】
数据仓库建模是组织和设计数据以支持数据分析的过程,包括ER模型和维度建模。ER模型通过实体和关系描述数据结构,遵循三范式减少冗余。维度建模,特别是Kimball方法,用于数据仓库设计,便于分析和报告。事实表存储业务度量,如销售数据,分为累积、快照、事务和周期性快照类型。维度表提供描述性信息,如时间、产品、地点和客户详情。数仓通常分层为ODS(源数据)、DWD(明细数据)、DIM(公共维度)、DWS(数据汇总)和ADS(应用数据),以优化数据管理、质量、查询性能和适应性。
1966 3
|
6月前
|
存储 分布式计算 运维
揭秘“撩”大数据的正确姿势:生动示例解说大数据“三驾马车”
揭秘“撩”大数据的正确姿势:生动示例解说大数据“三驾马车”
|
7月前
|
SQL 大数据 Java
大数据必知必会系列——萌新提问怎么定义HiveUDF函数?能否给个示例
大数据必知必会系列——萌新提问怎么定义HiveUDF函数?能否给个示例
67 0
|
大数据 数据挖掘 Java
大数据平台开发规范示例
大数据平台开发规范示例
239 0
|
SQL 大数据 数据挖掘
大数据平台开发规范示例1
大数据平台开发规范示例1
303 0
|
XML 前端开发 Java
大数据平台后端一些开发规范
在研发的过程中,总结一些开发规范,希望可以帮助到小伙伴们。
602 0
大数据平台后端一些开发规范