StarRocks Community Monthly Newsletter (Apr)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 本文介绍了StarRocks社区的最新动态,包括版本更新、应用工具、文档改进及精选内容。3.4.3版本新增Lambda表达式支持与JSON数据处理优化;运维工具有助于集群监控与权限管理;文档体验和功能描述得到提升。此外,还分享了多篇技术文章与视频教程,涵盖OLAP引擎实践、查询优化器解析等内容。本月启动了2025布道师计划,鼓励开发者参与社区共建,并公布了新晋Contributor名单。通过这些努力,StarRocks持续提升性能与用户体验。

0.PNG

版本动态

3.4.3 版本更新

核心功能升级

  • Routine Load和Stream Load新增Lambda表达式支持,支持复杂的列数据提取
  • 增强JSON数据处理能力,支持将JSON Array/Object转为ARRAY/MAP类型
  • 优化information_schema.task_runs视图查询,新增LIMIT支持

性能与稳定性提升

  • 修复查询ORC格式Hive表时的读取错误
  • 修复查询含Equality Delete文件的Iceberg表时RuntimeFilter无法下推的问题
  • 修复查询队列功能未启用时的超时误触发问题

🔎Release Note: https://docs.mirrorship.cn/zh/releasenotes/release-3.4/

3.4.2 版本更新

功能优化

  • FE支持优雅退出机制,通过./stop_fe.sh -g命令退出时会:
  • 向Load Balancer返回500状态码
  • 继续执行当前查询直至完成或超时(默认60秒)

性能与稳定性提升

  • 修复分区列为生成列时分区裁剪可能失效的问题
  • 修复concat函数参数处理导致的BE崩溃问题
  • 修复Broker Load导入时ssl_enable属性不生效的问题

3.3.13 版本更新

功能优化

  1. 审计日志和QueryDetail接口新增FE内存消耗指标
  2. 优化并发创建表达式分区的策略
  3. 新增存活FE节点数的监控指标
  4. information_schema.task_runs视图支持LIMIT下推
  5. 修复多个CVE安全问题
  6. 主键表PUBLISH阶段支持Retry机制
  7. 降低Flat JSON的内存占用
  8. information_schema.routine_load_jobs视图新增timestamp_progress列
  9. 增强LDAP授权验证机制
  10. AVRO文件与Hive表Schema不一致时明确报错
  11. 物化视图新增excluded_refresh_tables属性

性能与稳定性提升

  1. 修复Flat JSON不支持get_json_bool函数的问题
  2. 修复SHOW AUTHENTICATION语句返回密码的安全问题
  3. 修复percentile_count函数返回错误
  4. 修复大算子落盘策略导致的问题
  5. 修复BE黑名单后Stream Load仍分发任务的问题

🔎Release Note:https://docs.mirrorship.cn/zh/releasenotes/release-3.3/

3.3.12 版本更新

新增功能

  • 新增percentile_approx_weighted函数支持
  • 支持修改Hive Catalog和Hudi Catalog的Property配置
  • Paimon Catalog新增Manifest Cache功能
  • Paimon Catalog支持SHOW PARTITIONS操作
  • Paimon Catalog支持统计信息收集

功能优化

  • 统计信息收集功能多项优化与问题修复
  • 优化建表失败的错误提示信息
  • 增强Broker Load的重试机制
  • 提升array_generate函数执行效率

性能与稳定性提升

  1. 修复INSERT INTO FILES不支持CSV分隔符转换的问题
  2. 修复Iceberg REST Catalog的若干问题
  3. 修复基于视图的物化视图改写丢失谓词的问题
  4. 修复Paimon Catalog读取变更表失败的问题

StarRocks 应用

  1. StarRocks 集群运维工具

贡献者:夏天

  • 项目亮点:
  • 全局监控:一键查看集群核心指标、运行/排队任务及资源隔离状态
  • 深度洞察:细粒度监控节点资源(CPU/内存/存储)及查询负载
  • 精准定位:快速追踪特定SQL或连接,高效排查问题


  1. StarRocks 权限可视化工具

贡献者:夏天

  • 项目亮点:
  • 批量权限管理:支持3000+用户权限的集中查看与管理,告别繁琐的逐条SQL查询
  • 快速权限定位:一键检索特定用户/角色的权限明细,提升权限稽核效率
  • 多Catalog支持:适配复杂多Catalog环境,实现跨数据源的统一权限视图

文档动态

本月精选内容

文章精选

迈向云原生:理想汽车 OLAP 引擎变革之路

StarRocks 查询优化器深度解析

从被动救火到主动预防,StarRocks 监控与告警全攻略

RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库

千万级数据秒级响应!碧桂园服务技术引擎重构智慧社区新标杆

StarRocks 助力首汽约车精细化运营

StarRocks Compaction&内存异常问题深度剖析

如何实现 SQL Server 全库 2000+ 表高效同步至 StarRocks

StarRocks 存算一体集群迁移至存算分离,BE减少25%!

StarRocks问题复盘 Clone RUNTIME_ERROR 及修复

StarRocks Zonemap Index

Flink高性能读写StarRocks内表剖析

Apache Paimon数据湖查询引擎StarRocks

视频精选

【中字教程】数据入湖到可视化:Hudi+MinIO+StarRocks + HiveMetaStore + Apache SuperSet

本月精选活动

  1. StarRocks 社区 2025 布道师计划正式开启

StarRocks 社区 2025 布道师计划正式开启!我们诚邀开发者围绕技术内容创作、演讲分享、社区答疑三大方向参与共建:可以分享你在 AI、湖仓一体、性能优化等场景中的实践,也可以登上 Meetup 或技术峰会的舞台,更可以在论坛和微信群中积极答疑、助力他人。

每月将评选「社区答疑之星」,优秀作品和积分奖励将于 6 月底公布,并收录于社区月报。

参与方式、积分规则及积分商城详情,敬请查阅正文。来领奖啦!StarRocks 社区 2025 布道师计划正式开启

  1. StarRocks 小课堂 | 监控告警全覆盖,别等服务挂了才处理!

4 月 16 日,StarRocks 小课堂邀请镜舟科技 DBA 团队负责人景丹,深入解读监控告警前的核心要点,涵盖:

  • 服务监控 & 故障处理:FE/BE 服务挂起、Schema Change 失败、Compaction 异常等场景的应对方案;
  • 服务可用性监控:Checkpoint 异常、Routine Load 延迟、物化视图刷新失败等问题的排查技巧;
  • 资源 & 查询监控:CPU/内存过载、连接数异常、查询耗时升高等性能瓶颈的优化建议。

告别被动救火,掌握监控主动权

⏬演讲文档:从被动救火到主动预防,StarRocks 监控与告警全攻略

📺视频回放:StarRocks 小课堂| 监控告警全覆盖,别等服务挂了才处理!

本月新晋 Contributor

感谢新朋友们为 StarRocks 社区注入活力!期待你们继续闪耀光芒,与社区共同成长,创造更多精彩!✨🚀

GitHub:https://github.com/StarRocks/starrocks

中文社区官网:https://www.mirrorship.cn/zh-CN/community

相关文章
|
4月前
|
Oracle 关系型数据库 数据库
【赵渝强老师】在PostgreSQL中访问Oracle
本文介绍了如何在PostgreSQL中使用oracle_fdw扩展访问Oracle数据库数据。首先需从Oracle官网下载三个Instance Client安装包并解压,设置Oracle环境变量。接着从GitHub下载oracle_fdw扩展,配置pg_config环境变量后编译安装。之后启动PostgreSQL服务器,在数据库中创建oracle_fdw扩展及外部数据库服务,建立用户映射。最后通过创建外部表实现对Oracle数据的访问。文末附有具体操作步骤与示例代码。
141 6
【赵渝强老师】在PostgreSQL中访问Oracle
|
4月前
|
存储 算法
【赵渝强老师】Memcached的路由算法
Memcached支持两种客户端路由算法:求余数Hash算法和一致性Hash算法。求余数Hash算法通过键值对服务器数量取模分配数据,虽分布均匀但扩容缩容时易丢失数据。一致性Hash算法则通过哈希环减少数据丢失,仅影响故障节点相关数据,在集群扩容或节点宕机时表现更优。
96 10
|
4月前
|
SQL 人工智能 数据可视化
StarRocks MCP Server 开源发布:为 AI 应用提供强大分析中枢
StarRocks MCP Server 提供通用接口,使大模型如 Claude、OpenAI 等能标准化访问 StarRocks 数据库。开发者无需开发专属插件或复杂接口,模型可直接执行 SQL 查询并探索数据库内容。其基于 MCP(Model Context Protocol)协议,包含工具、资源和提示词三类核心能力,支持实时数据分析、自动化报表生成及复杂查询优化等场景,极大简化数据问答与智能分析应用构建。项目地址:https://github.com/StarRocks/mcp-server-starrocks。
|
4月前
|
存储 人工智能 运维
MoE大模型迎来“原生战友”:昇腾超节点重构AI基础设施
大模型训练中,MoE架构逐渐成为主流,但也面临资源利用率低、系统稳定性差、通信带宽瓶颈三大挑战。传统AI集群难以满足其需求,而“昇腾超节点”通过自研高速互联协议、软硬件协同调度、全局内存统一编址及系统稳定性提升等创新,实现384张卡协同工作,大幅提升训练效率与推理性能。相比传统方案,昇腾超节点将训练效率提升3倍,推理吞吐提升6倍,助力MoE模型在工业、能源等领域的规模化应用。5月19日的鲲鹏昇腾创享周直播将深度解析相关技术细节。
195 15
|
4月前
|
SQL 数据可视化 关系型数据库
Doris Manager 24.3 版本正式发布,增强集群巡检能力
Apache Doris 是全球领先的开源实时数据仓库,已被 5000+ 中大型企业广泛应用。为解决传统客户端工具在功能、成本及适配性上的不足,飞轮科技推出专为 Apache Doris 打造的可视化工具 SelectDB Studio。它提供 Desktop 和 Server 两个版本,支持永久免费使用,具备多数据源连接、SQL 编辑器、Profile 分析、日志检索、查询审计和权限管理等核心功能,深度集成 Apache Doris 的联邦查询与湖仓一体分析能力。未来还将新增数据导入与迁移功能,助力用户高效开发与管理数据。
308 27
|
4月前
|
机器学习/深度学习 人工智能 数据库
RAG 2.0 深入解读
本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事,还包括了RAG的技术升级和关键技术等。
744 85
|
4月前
|
人工智能 安全 应用服务中间件
阿里巴巴 MCP 分布式落地实践:快速转换 HSF 到 MCP server
本文分享了阿里巴巴内部将大规模HSF服务快速转换为MCP Server的实践经验,通过Higress网关实现MCP协议卸载,无需修改代码即可接入MCP生态。文章分析了MCP生态面临的挑战,如协议快速迭代和SDK不稳定性,并详细介绍了操作步骤及组件功能。强调MCP虽非终极解决方案,但作为AI业务工程化的起点具有重要意义。最后总结指出,MCP只是AI原生应用发展的第一步,未来还有更多可能性值得探索。
979 48
|
4月前
|
人工智能 PyTorch 算法框架/工具
ACK AI Profiling:从黑箱到透明的问题剖析
本文从一个通用的客户问题出发,描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查,最后到问题定位与解决、业务执行过程的分析,从而展现一个从黑箱到透明的精细化的剖析过程。
|
4月前
|
人工智能 Kubernetes Nacos
Nacos 3.0 正式发布:MCP Registry、安全零信任、链接更多生态
Nacos 3.0 正式发布,作为云原生时代的基础设施级产品,不仅提升了技术能力,还以更高效、安全的方式帮助用户构建云原生AI应用架构。此次升级包括MCP Registry,围绕MCP服务管理,支持多种类型注册(如MCP Server、编排、动态调试和管理),并提供Nacos-MCP-Router实现MCP动态发现与自动安装代理。安全性方面,默认开启鉴权,并支持动态数据源密钥等零信任方案。此外,Nacos 3.0 还强化了多语言生态,覆盖主流开发语言(Python、GoLang、Rust等),并与K8S生态打通,面向全场景提供统一管理平台。
855 96
Nacos 3.0 正式发布:MCP Registry、安全零信任、链接更多生态