光云科技 X AnalyticDB:构建 AI 时代下的云原生企业级数仓

简介: AnalyticDB承载了光云海量数据的实时在线分析,为各个业务线的商家提供了丝滑的数据服务,实时物化视图、租户资源隔离、冷热分离等企业级特性,很好的解决了SaaS场景下的业务痛点,也平衡了成本。同时也基于通义+AnalyticDB研发了企业级智能客服、智能导购等行业解决方案,借助大模型和云计算为商家赋能。


客户介绍

光云科技是中国首批电商SaaS服务商,是互联网SaaS模式的软件技术创新型企业。光云科技秉承“让企业经营更卓越”的使命,专注于为企业提供电商运营的全链路解决方案,致力于成为全球企业软件服务领域的领跑者。光云科技累计服务包括海澜集团、慕尚集团、地素集团、百丽集团、森马集团在内的数十家上市集团以及超过2000家大型国内知名电商及零售企业,服务范围涵盖服装、鞋靴、箱包、运动品类、配饰等泛时尚类目。


技术挑战

在Data+AI技术发展驱动下,电商软件服务正在发生变革,在线数据处理、实时分析和智能化决策成为新的业务趋势。随着海量数据在线处理、实时分析、智能化成为客户刚性需求,现有的数据仓库技术面临五大挑战。

挑战一:复杂自定义配置

业务上开放了自定义配置能力,商家修改配置后想要立马看到配置之后的数据。数据仓库引擎需要具备丰富的函数支持、事务以及复杂逻辑处理能力,能够根据配置在线重算历史数据并且对客提供分析服务。

挑战二:实时计算能力

海量数据需要数仓具备处理复杂逻辑的能力,并支持长周期窗口实时分析和与历史同环比分析的能力。

挑战三:长周期数据应用

长周期数据分析对商家来说很有价值,数据仓库引擎需要支持冷/热数据分层来控制长周期数据存储成本,引擎自动实现归档和路由,同时在开发和使用上对业务是无感的。

挑战四:混合业务负载

在业务高峰期同时存在高吞吐写入、批处理、实时计算和在线查询混合业务负载的需求。

挑战五: 高可用和高可靠

由于对外提供服务,因为需要保障业务的连续性。发生单节点宕机时需要保障集群性能不降级。


数仓升级之路

应对业务发展对技术的挑战,光云科技基于阿里云AnalyticDB for PostgreSQL实现了架构升级,打造新一代的在线数仓,同时构建AI原生的仓内智能能力,并且在AI创造场景上进行了探索。

动态资源弹升

数据产品对外提供付费服务,因为需要时刻保障业务连续性。开源MPP架构产品虽然能提供高可用能力,但在计算节点依赖的宿主机发生宕机情况下会影响整个集群的性能。为了保障集群性能不降级,AnalyticDB for PostgreSQL提供了动态资源弹升的能力。

流批一体实现商品分析

AnalyticDB for PostgreSQL提供增量实时物化视图,经过验证后符合生产的功能与性能要求:语法支持丰富,多表关联、嵌套子查询、窗口函数等复杂语法都可以支持。支持行级数据刷新和级联刷新,不需要业务上来实现数据任务的调度依赖。在Upsert下通过分布式直写计算节点能力可达到10W+ RPS的写入吞吐,目前在商品分析、利润分析、物流预警等场景上已实现落地。


混合负载与资源隔离

集群同时存在高吞吐写入、历史数据重算、实时计算和在线分析服务需求,因此需要支持混合业务的数仓负载。 AnalyticDB for PostgreSQL 基于CGroup、共享内存等实现资源组技术,支持对并发数、CPU资源、内存资源等进行管理;构建不同的资源组,根据业务在不同时间段的重要性动态地分配资源,比如在早上需要保障在线分析服务和实时计算的业务连续性,在数据刷新的资源可以调低一些。在凌晨则相反,批处理加工的资源最大,同时也保留一部分资源保障KA客户的分析服务。通过资源配置,在保证业务资源权重的基础上,充分利用其他租户业务的闲置资源。


冷热数据分层存储

AnalyticDB for PostgreSQL基于ESSD+OSS 实现数据冷热分层,降低数据存储成本。基于TTL/HPN进行自动化冷热调度,无需手动干预;:基于保留时间TTL或热分区数HPN进行自动冷热调度,无需定制业务逻辑。同时保障业务灵活性,支持分区级别冷热调度及字段值冷热调度,非时间字段分区表也可进行冷热分层


实时数据集成

AnalyticDB for PostgreSQL提供Zero-ETL、Kafka订阅、写入能力扩展和实时数据集成能力。

Zero-ETL:提供Zero-ETL服务,将分散、零乱、标准不统一的数据整合到一起,实现数据平滑“无感”的流动,为企业的决策提供分析依据,并降低建仓资源成本。

Kafka订阅:提供Streaming Server服务,支持订阅Kafka数据直接入库,将数据直接并行写入Segment节点,实现高性能流式数据写入。

写入能力扩展:支持横向及纵向扩展Streaming Server资源及节点数量,实现更高吞吐写入。

实时数据集成:提供Flink Connector和ClientSDK等,支持Flink及应用直接对接Streaming Server。


AI赋能业务的探索实践

光云科技在数据仓库之上进行了AI场景化探索,主要是企业级智能客服解决方案的实践。

大模型服务拥有强大的意图理解和人性化表达能力,并基于AnalyticDB for PostgreSQL引入私域知识,通过RAG能力调优提升知识匹配精准性、提高问答准确率,为客户提供严谨的智能导购服务。光云科技支持将各类ERP、OMS等外部系统集成到快麦小智,并支持前端淘宝、天猫等各类电商平台的交互,提供客服机器人、人工客服、自动化订单任务等多样化服务。


总结与展望

光云科技和AnalyticDB for PostgreSQL 一起打造了最适合电商行业的数据仓库及最佳实践,针对五大挑战提供了创新的技术解决方案,单一引擎同时满足离在线处理、实时数据分析和智能化场景,大大降低了开发和运维成本。同时,在业务上为商家提供灵活、敏捷、实时和智能的数据分析服务。通过这次的架构升级,光云科技完成了Data+A I升级和转型,对外能提供AI原生能力,让AI应用的开发和应用更普惠,通过循序渐进的探索和落地,未来在ERP 上一定会实现全面智能化。

光云科技在核心交易场景同时使用了阿里云数据库PolarDB,搭配Serverless实现无感动态弹升,用于承载电商大促交易。阿里云瑶池数据库助力光云科技业务稳定运行。

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
5月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
5月前
|
机器学习/深度学习 人工智能 监控
Java与AI模型部署:构建企业级模型服务与生命周期管理平台
随着企业AI模型数量的快速增长,模型部署与生命周期管理成为确保AI应用稳定运行的关键。本文深入探讨如何使用Java生态构建一个企业级的模型服务平台,实现模型的版本控制、A/B测试、灰度发布、监控与回滚。通过集成Spring Boot、Kubernetes、MLflow和监控工具,我们将展示如何构建一个高可用、可扩展的模型服务架构,为大规模AI应用提供坚实的运维基础。
417 0
|
6月前
|
存储 人工智能 数据可视化
企业级 AI 模型无代码落地指南:基于阿里云工具链,从 0 到 1 实现业务价值
某汽车零部件厂商通过阿里云PAI、OSS等工具,实现无代码AI质检落地:仅用控制台操作完成数据治理到部署,质检效率提升3倍,模型周期从2月缩至2周。本文详解全栈可视化方案,助力企业零代码落地AI。
736 1
|
6月前
|
数据采集 存储 人工智能
拆解AI-Agentforce企业级智能体中台:如何让企业AI落地从“噱头”到“实效”
在GDMS峰会上,迈富时集团尹思源指出41.3%中国企业尚未布局AI Agent,已应用者亦陷“Demo化、孤岛化”困局。其发布的AI-Agentforce智能体中台,以“冰山模型”重构架构,打通认知、价值、能力三重鸿沟,覆盖内容、获客、销售、陪练、分析五大场景,助力企业实现AI从“工具”到“数字员工”的全链路协同升级。
|
6月前
|
存储 人工智能 关系型数据库
阿里云AnalyticDB for PostgreSQL 入选VLDB 2025:统一架构破局HTAP,Beam+Laser引擎赋能Data+AI融合新范式
在数据驱动与人工智能深度融合的时代,企业对数据仓库的需求早已超越“查得快”这一基础能力。面对传统数仓挑战,阿里云瑶池数据库AnalyticDB for PostgreSQL(简称ADB-PG)创新性地构建了统一架构下的Shared-Nothing与Shared-Storage双模融合体系,并自主研发Beam混合存储引擎与Laser向量化执行引擎,全面解决HTAP场景下性能、弹性、成本与实时性的矛盾。 近日,相关研究成果发表于在英国伦敦召开的数据库领域顶级会议 VLDB 2025,标志着中国自研云数仓技术再次登上国际舞台。
693 0
|
6月前
|
存储 人工智能 安全
企业级 AI Agent 开发指南:基于函数计算 FC Sandbox 方案实现类 Chat Coding AI Agent
通过 Sandbox 与 Serverless 的深度融合,AI Agent 不再是“黑盒”实验,而是可被企业精准掌控的生产力工具。这种架构不仅适配当前 AI Agent 的动态交互特性,更为未来多模态 Agent、跨系统协作等复杂场景提供了可复用的技术底座。若您的企业正面临 AI Agent 规模化落地的挑战,不妨从 Sandbox 架构入手,结合函数计算 FC 的能力,快速验证并构建安全、高效、可扩展的 AI 应用系统。
人工智能 关系型数据库 OLAP
791 1
|
6月前
|
人工智能 IDE 开发工具
AI 编程,一键生成完整工程代码(企业级),开启零代码时代
飞算JavaAI是一款IDE插件,能将文字需求一键生成企业级完整工程代码,大幅提升开发效率。支持模块拆分、代码分层、数据库脚本生成,并可自定义代码风格与架构,适配团队规范。实现“零代码”开发与功能扩展,让开发者专注核心逻辑,告别重复编码。

相关产品

  • 云原生数据仓库AnalyticDB MySQL版