开源之夏2023学生报名启动!阿里云PolarDB社区项目期待你的参与!

本文涉及的产品
PolarClaw,2核4GB
简介: 近日,阿里云PolarDB开源社区入选由中科院软件所主办的“2023开源之夏”活动并发布了3个PolarDB项目任务。同学们可以登录官网,报名参与感兴趣的任务。我们诚挚地邀请各位学子加入我们的行列,一起来构建完全独立自主的、开源的、高性能及高可靠性的云原生数据库!成功结项后将获得丰厚奖金和证书!

开源之夏活动简介

开源之夏是由中科院软件所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。

活动联合各大开源社区,针对重要开源软件的开发与维护提供项目,并向全球高校学生开放报名。

学生可自主选择感兴趣的项目进行申请,并在中选后获得该软件资深维护者(社区导师)亲自指导的机会。根据项目的难易程度和完成情况,参与者还将获得开源之夏活动奖金和结项证书。


了解PolarDB开源社区

PolarDB是阿里云自主研发的新一代云原生数据库,既拥有分布式设计的低成本优势,又具有集中式的易用性。数年来,阿里云针对 PolarDB 进行了诸多创新,通过采用存储计算分离、软硬一体化设计,PolarDB 实现成本仅为传统商业数据库的十分之一。所实现的计算、内存与存储资源的“三层解耦”架构、多主多写、基于IMCI(内存列存索引)的 HTAP、Serverless 等功能已是全球首创或业内领先的技术。从 PolarDB 发布以来,它在技术和商业化上都获得了迅猛发展,如今已经成为阿里云数据库产品家族中最闪耀的产品。2021年,阿里云正式开源PolarDB,将PolarDB PostgreSQL 版(简称 PolarDB-PG )和 PolarDB分布式版(简称 PolarDB-X )进行了全内核开源,与社区一起共建云原生分布式数据库生态。


PolarDB 开源社区是阿里云数据库开源产品PolarDB的技术交流平台。作为开源的数据库产品, 离不开用户和开发者的支持, 大家可以在社区针对PolarDB产品提问题、功能需求、交流使用心得、分享最佳实践、提交issue、贡献代码等。


项目简介

本次活动,PolarDB 开源社区共发布了 3 个开发类项目课题:


任务一:PolarDB-X 向量化计算性能优化

项目难度:进阶

导师:思昀

导师邮箱:youtianyu.yty@alibaba-inc.com

项目简述:

向量化引擎为 PolarDB-X 的表达式计算带来了显著的性能提升,尤其在 HTAP 场景下,向量化计算是整个执行链路的重要一环。本项目的核心目标是在当前的向量化引擎框架下,针对不同数据类型进行算子和表达式的性能优化,提升执行效率。


本任务包括的功能点:

1. 搭建向量化计算性能测试框架,构造 benchmark

2. 向量化四则运算性能优化,包括常量与列之间的混合运算

3. 向量化 Agg 性能优化,包括 sum/count/avg 等

4. 向量化 Filter 性能优化

5. (可选)向量化 Join 性能优化

6. (可选)结合以上优化点,力争在部分 benchmark 场景有 5 到 10 倍的性能提升


项目技术要求:精通Java语言、熟悉性能优化

任务详情:https://summer-ospp.ac.cn/org/prodetail/2309e0088


任务二:PolarDB-X 支持列式存储文件的导入导出

项目难度:进阶

导师:离九

导师邮箱:lijiu.lzw@alibaba-inc.com

项目简述:

PolarDB-X 作为一款 HTAP 分布式数据库,正在逐步加强 AP 能力,在高计算场景下,大部分数据库都是采用列式存储数据。PolarDB-X 目前在冷热数据归档和正在开发的列式存储引擎都是采用列式存储文件保存数据,为了丰富用户对列式存储文件进行操作,本项目的核心目标是支持列式存储文件的导入导出。


本任务包含的功能点 :

1. 支持 Load Data 兼容列式存储文件的导入

2. 支持用户将行存文件(csv格式)转成列式文件(orc格式)

3. 支持导出数据以列式文件格式导出

4. 优化列式文件导入导出性能,超过行式文件


项目技术要求: 熟悉Java语言、了解数据库导入导出方式、列式存储格式和SQL基本执行流程

任务详情: https://summer-ospp.ac.cn/org/prodetail/2309e0089



任务三:利用pgreplay解析审计日志,提取PolarDB-PG数据库真实workload

项目难度:基础

导师:陌痕

导师邮箱:mohen.lhy@alibaba-inc.com

项目简述:

PolarDB 在升级或者不同环境中迁移时,需要关心迁移前后的稳定性、正确性以及性能指标。一个很好的测试方式是利用实例真实的 workload ,在不同实例上运行,然后对比结果。


pgreplay 是开源社区提供的一个解析日志,提取真实 workload 的工具,但目前支持解析的日志格式较少。


本项目希望 pgreplay 能够支持解析 PolarDB 中常用格式的审计日志,在此基础上解决解析的 SQL 未记录完整的场景,解析的 SQL search_path 未知的场景,解析的 SQL 参数化类型未知的场景,更进一步,能够提供进行结果比较与性能比较的能力。


项目技术要求:熟悉C语言,了解PostgreSQL的日志,了解pgreplay工作原理。

任务详情:https://summer-ospp.ac.cn/org/prodetail/2309e0138


学生报名要求

学生报名时间:2023 年 4 月 29 日至 6 月 4 日

学生指南:https://summer-ospp.ac.cn/help/student/

报名要求:

  • 本活动面向年满 18 周岁在校学生。
  • 暑期即将毕业的学生,只要在申请时学生证处在有效期内,就可以提交申请。
  • 中国籍学生参与活动需提供身份证、学生证、教育部学籍在线验证报告(学信网)或在读证明。
  • 外籍学生参与活动需提供护照,同时提供录取通知书、学生卡、在读证明等文件用于证明学生身份。


学生参与报名流程

各阶段流程操作均在点亮计划管理系统内进行,默认时区为北京时间(UTC+8)

1. 项目沟通

注册报名

  • 学生可通过活动官网首页学生登录入口,注册并登录点亮计划管理系统(以下简称:系统),并按活动要求填写信息完成报名。
  • 往届学生可登录原账号更新信息并报名。
  • 学生在社区开源仓库中提交的 git email 必须使用学生报名时所用的邮箱。
  • 学生不得同时以导师身份参加本活动。

挑选项目

  • 官网-查看项目 中,获取项目列表。
  • 学生最多可以提交三个项目的申请书,但最终只能承担一个项目。
  • 每个项目最多由一名学生承担。

与导师沟通

  • 官网项目描述中有项目指定导师的姓名与联系邮箱,学生可通过电子邮箱与导师进行沟通,邮件沟通是参与社区活动的基本方式。
  • 请学生注意与导师沟通的基本礼仪,导师仅提供力所能及的指导和建议,项目本身的申请、设计和开发都是由学生自己完成。
  • 此阶段既是了解项目详情的时期,也是了解社区运作方式、熟悉社区礼仪的时期。

2. 项目申请

准备项目申请材料

  • 查看 项目申请模板 并根据要求准备相关材料。
  • 项目申请书的质量是评定学生申请是否通过的最主要标准。

提交项目申请

  • 通过系统提交申请材料。
  • 学生最多可以提交三个项目的申请书,但最终最多只能承担一个项目。
  • 在提交项目申请时,需要对本人申请的所有项目的中选优先级进行排序,若同时被多个项目选中,则根据该学生提交的项目排序,优先中选优先级高的项目。


加入PolarDB项目交流群

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
6月前
|
SQL 关系型数据库 MySQL
开源新发布|PolarDB-X v2.4.2开源生态适配升级
PolarDB-X v2.4.2开源发布,重点完善生态能力:新增客户端驱动、开源polardbx-proxy组件,支持读写分离与高可用;强化DDL变更、扩缩容等运维能力,并兼容MySQL主备复制及MCP AI生态。
开源新发布|PolarDB-X v2.4.2开源生态适配升级
|
9月前
|
人工智能 关系型数据库 MySQL
轻松搭建AI知识问答系统,阿里云PolarDB MCP深度实践
无论是PolarDB MySQL兼容MySQL语法的SQL执行功能,还是其特有的OLAP分析与AI能力,通过MCP协议向LLM开放接口后,显著降低了用户使用门槛,更为未来基于DB-Agent的智能体开发奠定了技术基础
|
6月前
|
SQL 关系型数据库 MySQL
开源新发布|PolarDB-X v2.4.2开源生态适配升级
PolarDB-X v2.4.2发布,新增开源Proxy组件与客户端驱动,支持读写分离、无感高可用切换及DDL在线变更,兼容MySQL生态,提升千亿级大表运维稳定性。
1616 24
开源新发布|PolarDB-X v2.4.2开源生态适配升级
|
7月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
7月前
|
人工智能 关系型数据库 分布式数据库
手把手搭本地 RAG!用阿里云 PolarDB、Lindorm+Ollama,数据隐私全自己把控
教你用阿里云PolarDB和Lindorm存向量,Ollama跑本地大模型,LangChain串联流程,打造数据不出私网的离线智能问答系统,安全、省钱、可私有化部署,新手也能快速上手!
710 1
|
8月前
|
人工智能 关系型数据库 MySQL
开源PolarDB-X:单节点误删除binlog恢复
本文由邵亚鹏撰写,分享了在使用开源PolarDB-X过程中,因误删binlog导致数据库服务无法启动的问题及恢复过程。作者结合实践经验,详细介绍了在无备份情况下如何通过单节点恢复机制重启数据库,并提出了避免类似问题的几点建议,包括采用高可用部署、定期备份及升级至最新版本等。
|
12月前
|
关系型数据库 分布式数据库 数据库
一库多能:阿里云PolarDB三大引擎、四种输出形态,覆盖企业数据库全场景
PolarDB是阿里云自研的新一代云原生数据库,提供极致弹性、高性能和海量存储。它包含三个版本:PolarDB-M(兼容MySQL)、PolarDB-PG(兼容PostgreSQL及Oracle语法)和PolarDB-X(分布式数据库)。支持公有云、专有云、DBStack及轻量版等多种形态,满足不同场景需求。2021年,PolarDB-PG与PolarDB-X开源,内核与商业版一致,推动国产数据库生态发展,同时兼容主流国产操作系统与芯片,获得权威安全认证。
|
9月前
|
存储 关系型数据库 分布式数据库
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
|
10月前
|
关系型数据库 分布式数据库 数据库
再获殊荣,阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
内存池化技术新突破,阿里云PolarDB蝉联SIGMOD最佳论文奖

相关产品

  • 云原生数据库 PolarDB