倒带ChunJun,同心前行|2022年度回顾&2023年共建规划

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 2022 是 ChunJun在技术长廊中探索和成长的第四个年头,悄然度过了自己的 “孩提 “时光。2022,我们相继完成了核心数据还原功能框架、数据还原支持中间处理/DDL自动转换、框架支持全量增量实时同步等功能。目的只有一个:「希望为大家真正提供一个稳定、高效、易用的批流一体的数据集成框架」。现在,让我们倒带 2022,展望2023,和一直以来关注ChunJun开源社区的朋友聊聊过去、未来……

ChunJun是一个开始于2018年的批流一体数据集成框架项目,原名FlinkX。2022年2月22日,在FlinkX进行初版开源的整整四年后,技术团队决定对FlinkX进行整体升级,并更名为ChunJun,希望为大家真正提供一个稳定、高效、易用的批流一体的数据集成框架

2022年的ChunJun茁壮成长,如今已经是一个由68多位贡献者协同开发、拥有3437个star的人气项目。

项目地址:https://github.com/DTStack/chunjun

ChunJun 项目进展

Star数:3437                  Fork数:1556

Issue Closed:764         PR Cloesd:523

Contributors:68           Commits:5147

ChunJun 内容输出

视频课程:共计15课

涵盖直播课程、入门指南、解决方案等方方面面

精品文章:共计18篇

带你快速了解chunJun

技术社群:3898人

已成为大量开发者及大数据爱好者的交流学习平台

ChunJun 奖项荣誉

入选Gitee最有价值开源项目——GVP

image.png

2022 ChunJun大事记

送虎岁,迎兔年,值此除旧迎新之际,想和一直以来关注ChunJun开源社区的朋友聊聊这一年的进展:

2022年2月22日

沉淀了团队六年来在数据同步和集成方面的实践经验,技术团队决定对FlinkX进行整体升级,并更名为ChunJun。希望为大家真正提供一个稳定、高效、易用的批流一体的数据集成框架

2022年5月28日

ChunJun社区第一次会议,讨论当前第一个版本的roadmap规划,首次邀请社区小伙伴一起参与讨论。内容包括减少启动参数,让用户快速启动;增加 Docker 部分,用户直接下载Docker 镜像,开箱即用等。

2022年6月25日

开源小伙伴贡献的官网内容正式发布。

官网地址:https://dtstack.github.io/chunjun/

2022年7月9日

ChunJun社区第二次会议,讨论当前第二个版本的roadmap规划。

2022年9月18日

ChunJun社区第三次会议,讨论当前第三个版本的roadmap规划,调整 pr review & merge 规范和流程。

2022 ChunJun活动

2022年8月27日

联合OceanBase社区主办开源线下Meetup,发布基于Oceanbase 的离线插件和cdc 插件,并推出联合方案

image.png

2022年9月24日

参与Hadoop MeetUp,分享ChunJun在实时采集上的功能和新特性。

image.png

2022年10月29日

联合举办 COSCon'22 开源年会杭州分会场,分享袋鼠云三大组件 ChunJun、Taier、ChengYing 的配套使用构建。

image.png

2022 ChunJun精品课程

2022年4月27日

课程:ChunJun支持异构数据源DDL转换与自动执行

视频链接:https://sourl.cn/i9CzDP

2022年6月27日

课程:ChunJun数据还原-DDL功能模块解析

视频链接:https://sourl.cn/ffwtMc

2022年7月6日

课程:ChunJun同步Hive事务表

视频链接:https://sourl.cn/fbaWgD

2022年8月19日

课程:ChunJun数据传输模块介绍

视频链接:https://sourl.cn/iLY7vn

2022年9月22日

课程:ChunJun类加载原理与实现

视频链接:https://s.r.sn.cn/WCWURr

2022年12月9日

课程:ChunJun数据安全之Kerberos介绍

视频链接:https://s.r.sn.cn/Nix84z

2022 ChunJun研发进展

共发布七个版本:

V1.12.1

· 核心数据还原功能框架开发完成,增加了binlog/logminer 对 DDL 的监听处理;

· 丰富插件,添加Doris 插件;

· 添加ChunJun 对 Flink python udf 的支持;

· 稳定性提升,修复ChunJun 20+ bug。

V1.12.2

· 丰富插件, 添加 inceptor插件;

· 丰富插件,添加 influxdb插件;

· 代码优化,使用插件 spotless-plugins强制对代码风格进行检查;

· es 插件优化,支持 ssl模式;

· gbase 插件优化,支持 update模式;

· k8s 模式下添加对 application mode支持;

· 稳定性提升,修复ChunJun 10+ bug。

V1.12.3

· 丰富插件, 添加 starrocks插件;

· 增量同步支持 datetime类型;

· SQLserver cdc增加对数据类型 smallint的支持;

· 稳定性提升,修复ChunJun 10+ bug。

V1.12.4

· 丰富插件,添加 oceanbase插件;

· 数据还原功能加强,添加中间数据存储,避免数据丢失;

· 项目名称调整,从 FlinkX修改为 ChunJun;

· 插件优化,调整 inceptor插件的读取方式,从原来的 jdbc调整为直接读取文件;

· 插件优化,pg读取插件支持 Array类型;

· 增加对 protobuffer format的支持;

· 稳定性提升,修复ChunJun 20+ bug。

V1.12.5

· 数据同步 jdbc分片优化,添加对 range mode的支持,原先只支持 mod模式分片;

· 易用性提升,添加内置提交脚本,在不同模式下任务提交需要传入的参数,只需要传递 -job和 -confProp即可;

· ChunJun增加一个模块,准备用于发布安装包;

· 稳定性提升,修复ChunJun 15+ bug。

V1.12.6

· 优化 ChunJun数据同步的序列化方式;

· ChunJun 添加新的官网,方便社区同学了解阅读文档及技术方案;

· 丰富插件, 添加 rocketmq、sybase、s3、vertica11、iceberg插件及 redis读取插件;

· docker模式的支持,并添加执行脚本和文档;

· jdbc 插件增强,添加在执行前检查 dbconn;

· hbase 插件优化和重构,支持 transformer;

· ChunJun 工程支持E2E 功能;

· oracle 插件增强支持 nchar、nvarchar2 类型的中文存储;

· 稳定性提升,修复ChunJun 30+ bug。

V1.12.7

· 优化 jdbc base模块,添加对列信息的初始化功能

· 优化 ftp读取性能,添加对大文件切片的支持;

· hdfs 插件优化,支持 hadoop3.x 版本 orc读取;

· e2e 功能丰富,添加 ftp container;

· es7 插件优化,支持 type关键字;

· 稳定性提升,修复ChunJun 30+ bug。

2023年的ChunJun

ChunJun未来规划

· 依赖 Flink版本升级到1.16;

· ChunJun 提供Rest api 的server 服务,简化ChunJun 集成的难度;

· ChunJun 添加数据还原DDL支持Iceberg、Hudi。

兔年祝福

2022年,感谢 ChunJun社区小伙伴们的大力支持,ChunJun走的每一步都离不开你们的帮助,2023年,我们继续交流,一起进步。

也祝福大家在新的一年里兔飞猛进,快乐,幸福~💗


想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szalykfz

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术 qun」,交流最新开源技术信息,qun 号码:30537511,项目地址:https://github.com/DTStack

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
目录
相关文章
|
4天前
|
消息中间件 Kubernetes Cloud Native
iLogtail 开源两周年:感恩遇见,畅想未来
凡是过往,皆为序章;iLogtail 社区,是我们共同编织的果实。所有将来,皆为可盼;LoongCollector,是我们共筑的未来。
163 63
《接手一个6年的平台型系统:我是如何带领团队破局前行的》电子版地址
接手一个6年的平台型系统:我是如何带领团队破局前行的
67 0
《接手一个6年的平台型系统:我是如何带领团队破局前行的》电子版地址
《以架构视角解读和落实银行数字化转型的两份重磅指导文件》电子版下载地址
2021年12月和2022年1月,两份关于银行数字化转型的重量级指导文件—中国人民银行的《金融科技发展规划(2022—2025 年)》和银保监会的《关于银行业保险业数字化转型的指导意见》先后印发,这对在积极筹备数字 化转型工作的各类银行而言,正是 2022 年开年布局的最好指导。两份文件都对银行的数字化转型提出了具体要求,二者各各有侧重、相辅相成、有机融合。
113 0
《以架构视角解读和落实银行数字化转型的两份重磅指导文件》电子版下载地址
《不忘初心,方得始终-盒马数据中台之道》电子版地址
不忘初心,方得始终-盒马数据中台之道.ppt
110 0
《不忘初心,方得始终-盒马数据中台之道》电子版地址
|
存储 Oracle 安全
万物并作,吾以观复|OceanBase 政企行业实践
万物并作,吾以观复|OceanBase 政企行业实践
262 0
万物并作,吾以观复|OceanBase 政企行业实践
|
数据采集 自然语言处理 数据管理
中移集成-首届OneCity编程大赛复盘
中移集成-首届OneCity编程大赛复盘
189 0
中移集成-首届OneCity编程大赛复盘
|
人工智能 算法 搜索推荐
又一个行业PaaS即将落地,你准备好了吗?
又一个行业PaaS即将落地,你准备好了吗?
182 0
又一个行业PaaS即将落地,你准备好了吗?
|
程序员 iOS开发
五年了还在原地踏步咋整?技术大佬给你整理了一套切实可行的方法论
五年了还在原地踏步咋整?技术大佬给你整理了一套切实可行的方法论
120 0
|
机器学习/深度学习 分布式计算 DataWorks