StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: StarRocks Connect 2025 聚焦“连接”,汇聚全球技术领袖,探讨数据分析的现在与未来。从性能引擎到AI Native平台,StarRocks 持续进化,赋能 Shopee、携程、Cisco 等企业实现高效实时分析,并推动开源生态与商业化协同发展。

导读:

9 月 13 日, StarRocks Connect 2025 于线上线下同步举行并圆满落幕。作为 StarRocks 全球峰会在中国本土的延伸,本次活动以“连接”为核心主题,吸引了数万名开发者与行业专家参与。

活动汇聚了来自镜舟科技、携程、Shopee、Cisco、SJM Resorts 等全球知名企业的一线技术领袖,共同分享了 StarRocks 在复杂业务场景下的前沿实践,并深度探讨了数据分析技术的未来演进方向。

技术演进:从性能引擎到 AI Native 平台

StarRocks TSC Member、镜舟科技 CTO 张友东《StarRocks: Connect Data Analytics with the World》为主题,分享了 StarRocks 从“过去、现在、未来”三个维度的发展进程。

1. 连接世界(过去)

历经五年发展,StarRocks 已成为一个拥有超 11,000 GitHub Stars、500 余位代码贡献者和全球数万名社区用户的顶级开源项目,用户版图横跨亚、美、欧,覆盖了从 Shopee、Grab 到 Microsoft、Pinterest 等超过 500 家行业领导企业。

2. 连接现代数据分析(现在)

面对从传统 BI 向运营分析(Operational Analytics)演进带来的实时、高并发挑战,StarRocks 凭借其统一湖仓引擎,有效解决了“烟囱式”架构的弊病。


StarRocks 的性能持续精进,TPC-DS 测试成绩从 2.0、3.0 到即将发布的 4.0 版本一路提升。同时,针对半结构化数据的核心功能 FlatJSON 也在 4.0 中迎来了 V2 版本的重大优化,性能提升超 10 倍。


通过在存算分离架构下实现极致性价比的实时分析、强大的查询性能以及接近原生表性能的数据湖分析能力(性能达 Trino 的 3-5 倍),StarRocks 已成功支撑 Pinterest 广告平台、Fanatics 体育平台、淘宝闪购等复杂业务,实现了高达 90%的成本节约。

3. 连接 AI Agent(未来)

张友东首次分享了将于 10 月发布的 StarRocks 4.0 在 AI Agent 辅助数据建模方面的探索。


通过创新的 Multi-Agent 协作框架,AI 能够智能分析用户输入,自动推荐最优建表语句,其准确率远超传统大模型。他强调,未来的数据系统必须具备自然语言接口、实时上下文感知、低延迟高并发等特性,才能真正成为“AI Agent Ready”的系统。


演讲最后,张友东宣布:“在 StarRocks 之上构建的 Multi-warehouse 企业级能力将正式开源,希望用开源技术帮助大家创造更大的业务价值。”

商业化视野:从生态构建到市场验证

镜舟科技解决方案架构师石强则从商业化视角,分享了 StarRocks 社区背后的可持续发展模式。


商业进展是最好的市场验证。石强展示了镜舟科技在商业化上取得的切实进展。通过服务在全球拥有复杂业务的头部企业,StarRocks 的能力在处理复杂跨国业务场景以及生产环境中得到了验证。

商业投入驱动企业级能力建设。他强调,许多企业级客户关注的重点,如严格的安全合规(ISO/IEC 27001, SOC 2 Type II 认证)、完善的生态对接(与 Databricks、AWS 等主流平台的官方合作),往往需要商业公司投入大量资源去完成。这些由商业化驱动的投入,极大地提升了 StarRocks 在大型企业中的可信度和部署可行性。

落地实践:一线企业如何利用 StarRocks 解决业务问题

如果说技术演进是“做什么”,那么企业实践则回答了“解决了什么”。

现场来自全球的企业用户展示了 StarRocks 在真实生产环境中的卓越表现,覆盖电商、旅游、跨国协作、数据治理等多个核心领域。

Shopee:驱动核心电商业务的实时引擎

作为东南亚电商巨头,Shopee 大数据专家工程师马腾分享 StarRocks 如何应用于其的业务场景,包括广告投放效果的实时监控、收入损失分析平台、百万级卖家健康度指标库以及 ShopeePay 支付与保险等高并发金融业务,以湖仓一体架构从容应对大促挑战,实现了高性能与高可用的完美平衡。

携程:以极致性能支撑业务出海


携程大数据平台开发专家魏宁、携程 IBU Data Engineer 蔡俊卿在分享中提到,通过经典的存算一体与先进的存算分离架构并用,携程高效处理海量订单与用户行为数据。在多个核心场景中,StarRocks 带来了高达 98%-100%的查询性能提升,为携程的全球化业务拓展和超个性化用户体验提供了坚实的数据支撑。

Cisco:跨国巨头内部的性能与成本双优之选


来自 Cisco 团队的白旭与许鸿坤通过详实的数据对比,展示了 StarRocks 在 Webex 业务中的优势。性能上,查询速度平均比 Trino 快 21%-53%;存储上,处理 17.5 亿行数据时,StarRocks 的存储占用仅为 Pinot 的 1/4,成本效益显著。其全面的功能集与完善的权限体系,也成为 Cisco 选择 StarRocks 的关键。

SJM Resorts:现代数据栈赋能智慧旅游


SJM Resorts 企业方案设计高级经理胡翔展示了“dbt + DataOps + StarRocks”组合能力。通过将数据建模、版本控制、自动化测试与部署无缝集成,SJM Resorts 构建了一套高效、可靠的数据治理体系,将数据洞察力注入复杂的旅游休闲服务中,极大提升了决策信息的质量与时效性。

共话数据基础设施的下一站

圆桌讨论环节为当前的 AI 热潮注入了一剂“清醒剂”,将话题拉回到务实的融合路径上。在白鲸开源 CEO 郭炜的主持下,嘉宾们达成共识:“大数据已死”是伪命题。


正如中启乘数科技创始人及 CTO 唐成所言:“大数据并非消亡,而是在 AI 推动下进行架构、技术等方面的演进调整。”

对于未来架构,讨论的结论并非颠覆,而是适配。短期内,数据基础设施的核心任务是增强自身以服务于 AI,例如统一元数据、强化向量搜索能力,并处理好非结构化数据的 ETL 这类“脏活累活”。镜舟科技 CEO 孙文现指出:“大模型直接吞吐所有数据是美好想象,但几乎不可能实现,更现实的是让大模型增强大数据能力。”


回归到人的价值,AI 不会替代优秀的工程师,但会淘汰重复性的工作。正如英飞流联合创始人张颖峰所强调的,“知道做什么(发现问题)”将比“知道怎么做(解决问题)”更重要,这为数据从业者指明了价值提升的方向。


相关文章
|
4天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1106 0
|
3天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
531 10
|
13天前
|
人工智能 运维 安全
|
12天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。
|
4天前
|
弹性计算 Kubernetes jenkins
如何在 ECS/EKS 集群中有效使用 Jenkins
本文探讨了如何将 Jenkins 与 AWS ECS 和 EKS 集群集成,以构建高效、灵活且具备自动扩缩容能力的 CI/CD 流水线,提升软件交付效率并优化资源成本。
301 0
|
11天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
807 23
|
4天前
|
缓存 供应链 监控
VVIC seller_search 排行榜搜索接口深度分析及 Python 实现
VVIC搜款网seller_search接口提供服装批发市场的商品及商家排行榜数据,涵盖热销榜、销量排名、类目趋势等,支持多维度筛选与数据分析,助力选品决策、竞品分析与市场预测,为服装供应链提供有力数据支撑。
|
4天前
|
缓存 监控 API
Amazon item_review 商品评论接口深度分析及 Python 实现
亚马逊商品评论接口(item_review)可获取用户评分、评论内容及时间等数据,支持多维度筛选与分页调用,结合Python实现情感分析、关键词提取与可视化,助力竞品分析、产品优化与市场决策。