6月11日-13日,2023开放原子全球开源峰会在北京举行。峰会上,阿里云公布1+4开源战略,数据库作为重要组成部分, 阿里云瑶池数据库与各开源社区领导者和数据库领域专家一起,围绕开源数据库技术中的“云原生、Serverless、HTAP、多模、AI+DB”等关键技术潮流和创新场景展开讨论,共同探讨开源数据库在新一波技术浪潮中的发展趋势。
开源数据库技术正在日益受到重视,并成为数据技术源头创新的主流力量,这源于社区和企业的共同努力。PolarDB作为阿里云瑶池核心自研云数据库,于2021年正式开源。截止目前,PolarDB开源社区建立了 11 个 SIG 组,吸引了 2 万名多贡献者和社区用户,同时吸引了韵达、莲子数据、网易数帆、龙蜥、武汉大学、乘数科技等 50 多个生态伙伴。今年,阿里云还正式发布了“数据库PB开源人才计划”,旨在将PolarDB打造为具有全球影响力的开源数据库。
PolarDB 作为开源的云原生分布式数据库, 支撑了阿里巴巴双十一业务, 同时作为云产品为广大企业提供了高质量的服务。为了更好的为广泛用户提供服务, 在开源后需要生态的共同建设与支持,PolarDB开源社区正不断努力与高校、培训商、服务商、产品集成、工具、新闻媒体、机构等产学研单位一起投入到开源数据库生态的建设当中, 相互支持, 为产业提供创新的土壤。
因云而聚,携手共赢,莲子数据与众多科技公司一起成为PolarDB 开源社区的生态成员,作为PolarDB 开源数据库的生态合作企业,莲子数据库一体机结合PolarDB 的生态可以赋能广大工业企业,近期在工业数字化应用的一个实际案例就生动体现了软硬深度结合的价值。
某企业用户是一家拥有自主知识产权的国际化工业技术创新公司,其生产的主要产品包括为世界五百强企业产品提供的高级传感器。其生产制造基地在中国,研发工程师和数据科学家大部分在海外,用户的核心工业技术具备非常强的竞争力,在全球行业链条中属于前沿创新方向。由于生产制造全过程采用了类半导体的生产工艺和技术,具有全自动高效生产的特点,其生产制造过程既有需要精密控制各工艺过程的流程化工属性,又有精密光刻及化学处理的基于机理反应的物理、化学过程,因此需要对制造过程中产生的大量工艺控制数据、过程检测数据进行实时的计算、分析和处理,既要了解当前生产的产品其过程控制水平、质量状况,同时要进行实时缺陷分析,快速定位不良品产生的原因。
由此该企业的IT负责人提出其在产线本地部署的工业数据平台需要具备如下能力特性:
1.边缘计算集群需要具备对多个异构数据源数据进行实时归集,对多维度的数据进行实时处理计算的能力。
2.边缘部署,云边协同。边缘侧和云端采用一致的数据处理架构,便于其复杂的生产制造工程全球布局。
3.产品导入后其产线将快速扩张,因此边缘侧系统服务需要满足灵活弹性扩容,按需随时增加服务节点,而无须停产线重新部署系统。
4.边缘计算集群需具备强大的实时数据处理分析的能力,支持人工智能模型计算。
5.应用层支持低代码开发环境。系统移交用户后,无须配备专业的IT人员,用户的研发、工艺、质量和数据工程师可以在新产品和新工艺的开发过程中,通过配置方式,完成软件系统的应用,加快其研发迭代的速度和效率。
该企业用户在广泛对比市场各种主流服务器方案和各类数据平台的优缺点之后,软硬一体化的莲子边缘计算一体机最终入围用户的实施方案,一体机上部署了基于PolarDB最新社区版本内核生态定制的分布式数据仓库,算力和存储扩容随用户需求的增加只需简单增加服务计算节点。软件系统兼容性良好,可以按需部署在全球主流云计算平台,与工厂边缘侧的系统完全一致,实现无缝云边协同。一体机预装的莲子智能数据管道系统,可以通过系统初始化配置,实时获取生产过程、质量检测、产品设计、物料、设备及管理数据,并做实时转换ELT处理,基本平替了传统互联网行业数据中台中最核心的技术功能。数据计算为并行计算模式,对已知机理的数据进行分层分类处理,快速响应工艺和质量工程师对过程和质量的分析。对那些未知的需要继续探索的数据,可以传输用户到建设的存储数据湖中,用于研发过程的数据挖掘和AI分析。
目前该项目已顺利落地一期,企业用户使用这个数据平台支持其日常生产的过程,在超过半年的生产环境运行过程中没有出现系统不稳定的问题,同时整体系统几乎低于INTEL同类系统功率一个数量级,肉眼可见的超低功耗也体现了绿色环保的节能特性,设备无需标准IDC空调制冷环境即可在常温下常年稳定可靠运行,符合工业行业双碳节能减排的政策要求。应用开发平台采用低代码配置方式后,用户正在用这样一个创新平台工具支持新产品和新工艺的开发,快速响应市场的变化和需求。随着该数据平台生产数据量的迅速增长,第二期将应用大模型计算方案与数据平台对接,以工业AI的手段,来提高用户的产品设计和制程管控的能力。