Apache Doris 2.1.1 版本正式发布

简介: Apache Doris 2.1.1 版本正式发布

2023 年 3 月,在阿里云瑶池数据库峰会上,阿里云与飞轮科技正式达成战略合作协议,双方旨在共同研发名为“阿里云数据库 SelectDB 版”的新一代实时数据仓库,为用户提供在阿里云上的全托管服务。
SelectDB 是飞轮科技基于 Apache Doris 内核打造的聚焦于企业大数据实时分析需求的企业级产品。因此阿里云数据库 SelectDB 版也延续了 Apache Doris 性能优异、架构精简、稳定可靠、生态丰富等核心特性,同时还融入了云服务随需而用的特性,通过云原生存算分离的创新架构,为企业带来分钟级弹性伸缩、高性价比、简单易用、安全稳定的一键式云上实时分析体验。
为了更深度的了解阿里云数据库 SelectDB 版,我们可以全面多角度的了解 Apache Doris 的应用实践和经验。

亲爱的社区小伙伴们,Apache Doris 2.1.1 版本已于 2024 年 4 月 3 日正式发布。该版本针对 2.1.0 版本出现的问题进行较为全面的优化,提交了若干改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。

1 行为变更

  1. 改变了 Float 类型字段返回值序列化的方式,可以提升大数据量下 Float 返回的性能。
  1. 将部分 Table Valued Function 变更为系统表 active_queries(), workload_groups()
  1. 由于 show query``/l``oad profile stmt 语句在实际用户场景中使用较少,该语句将不再支持与维护。同时该功能在 Pipeline 与 PipelineX 引擎中不支持。
  1. 升级 Arrow Flight 版本至 15.0.2,同时用户需要使用 ADBC 15.0.2 版本访问 Doris。

2 升级问题

  1. 修复了从 2.0.x 滚动升级至 2.1.x 的过程中,部分 BE 节点升级出现 Core 的问题。
  1. 修复了在 2.0.x 滚动升级至 2.1.x 过程中,使用 JDBC Catalog 会出现 Query 报错的问题。

3 新功能

  1. 默认开启列级权限。
  1. Pipeline 和 PipelineX 引擎能够在 K8S 下准确获取 CPU 核数。
  1. 支持读取 Parquet INT96 类型
  1. 支持 IP 透传的协议,以方便在 FE 之前启用代理的同时还能获取客户端准确的 IP 地址,实现白名单权限控制。
  1. 增加对 Workload Queue 检测指标。
  1. 增加系统表 backend_active_tasks,以实时监测每个 BE 上活跃任务以及消耗的资源信息。
  1. 在 Spark Doris Connector 中增加 IPV4 和 IPV6 的支持。
  1. CCR 支持倒排索引。
  1. 支持查询 Experimental 的 Session Variable。
  1. 支持建立 bitmap_union(bitmap_from_array()) 函数的物化视图。
  1. 支持对 Hive 中 HIVE_DEFAULT_PARTITION 分区进行列裁剪。
  1. 支持 set variable 语句中使用函数。
  1. Arrow 序列化方式增加对 Variant 类型的支持。

4 改进与优化

  1. 当系统自动重启或者滚动升级之后,自动启动 Routine Load 导入任务。
  1. 优化了 Routine Load 任务在各个 BE 上的分布方式,让各个 BE 负载更加均衡。
  1. 升级 Spark 的版本,解决部分 Spark Load 的安全问题。
  1. 在冷热分离过程中,自动跳过被删除的 Tablet.
  1. Workload Group 支持对 Routine Load 的资源进行限制。
  1. 大幅度优化多表物化视图查询改写性能。
  1. 优化 Broker Load 任务对 FE 的内存使用
  1. 优化 Partition 的裁剪逻辑。
  1. 优化 Tablet Schema Cache 对 BE 内存使用。
  1. 多表物化视图增加更多对 JOIN 类型的支持,包括 INNER JOIN、LEFT OUTER JOIN、RIGHT OUTER JOIN、FULL OUTER JOIN、LEFT SEMI JOIN、RIGHT SEMI JOIN、LEFT ANTI JOIN、RIGHT ANTI JOIN

5 Bugs 修复

  1. 修复 TopN 下推导致的问题。
  1. 修复 JAVA UDF 带来的内存泄露问题。
  1. 修复 ODBC 表备份恢复问题。
  1. 修复对 Variant 类型进行运算时常量折叠会导致 BE 出错的问题
  1. 修复了部分导入任务失败时 Routine Load 卡住的问题。
  1. 修复 SEMI JOIN 结果不正确的问题。
  1. 当列的数据为空时,修复建立倒排索引会出错的问题。
  1. 修复<=> join 操作会出现 Core 的问题。
  1. 修复部分列更新在有 Sequence 列结果准确性的问题。
  1. 修复 Select Outfile 导出到 Parquet 或者 ORC 格式的列类型映射问题。
  1. 修复在 Restore 过程中 BE 有时候会 Core 的问题。
  1. 修复 array_agg函数结果不对的问题。
  1. 使 Variant 类型应当一直是 nullable.
  1. 修复 Schema Change 没有正确处理空 Block 的问题。
  1. 修复使用 json_length() 函数时部分场景会出错的问题。
  1. 修复 Iceberg 表没有正确处理 Date Cast 转换的问题。
  1. 修复 Variant 类型建立 Index 时出现的部分 Bug。
  1. 修复当多个 map_agg 函数同时使用时结果不正确的问题。
  1. 修复 money_format 函数的返回结果不正确的问题。
  1. 修复在高并发的建立链接时部分请求会卡住的问题。
目录
相关文章
|
8月前
|
消息中间件 OLAP Kafka
Apache Doris 实时更新技术揭秘:为何在 OLAP 领域表现卓越?
Apache Doris 为何在 OLAP 领域表现卓越?凭借其主键模型、数据延迟、查询性能、并发处理、易用性等多方面特性的表现,在分析领域展现了独特的实时更新能力。
744 9
|
7月前
|
存储 自然语言处理 分布式计算
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
Apache Doris 3.1 正式发布!全面升级半结构化分析,支持 VARIANT 稀疏列与模板化 Schema,提升湖仓一体能力,增强 Iceberg/Paimon 集成,优化存储引擎与查询性能,助力高效数据分析。
929 4
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
|
8月前
|
存储 分布式计算 Apache
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
小米通过将 Apache Doris(数据库)与 Apache Paimon(数据湖)深度融合,不仅解决了数据湖分析的性能瓶颈,更实现了 “1+1>2” 的协同效应。在这些实践下,小米在湖仓数据分析场景下获得了可观的业务收益。
1380 9
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
|
8月前
|
人工智能 运维 监控
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
本文基于 Apache Doris 数据运维治理 Agent 展开讨论,如何让 AI 成为 Doris 数据运维工程师和数据治理专家的智能助手,并在某些场景下实现对人工操作的全面替代。这种变革不仅仅是技术层面的进步,更是数据运维治理思维方式的根本性转变:从“被动响应”到“主动预防”,从“人工判断”到“智能决策”,从“孤立处理”到“协同治理”。
1307 11
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
|
7月前
|
SQL 人工智能 数据挖掘
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
Apache Doris 4.0 原生集成 LLM 函数,将大语言模型能力深度融入 SQL 引擎,实现文本处理智能化与数据分析一体化。通过十大函数,支持智能客服、内容分析、金融风控等场景,提升实时决策效率。采用资源池化管理,保障数据一致性,降低传输开销,毫秒级完成 AI 分析。结合缓存复用、并行执行与权限控制,兼顾性能、成本与安全,推动数据库向 AI 原生演进。
731 0
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
|
8月前
|
SQL 存储 运维
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
本文介绍了 Apache Doris 在菜鸟的大规模落地的实践经验,菜鸟为什么选择 Doris,以及 Doris 如何在菜鸟从 0 开始,一步步的验证、落地,到如今上万核的规模,服务于各个业务线,Doris 已然成为菜鸟 OLAP 数据分析的最优选型。
478 2
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
|
8月前
|
SQL 存储 JSON
Apache Doris 2.1.10 版本正式发布
亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
368 5
|
8月前
|
人工智能 自然语言处理 数据挖掘
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
在即将发布的 Apache Doris 4.0 版本中,我们正式引入了一系列 LLM 函数,将前沿的 AI 能力与日常的数据分析相结合,无论是精准提取文本信息,还是对评论进行情感分类,亦或生成精炼的文本摘要,皆可在数据库内部无缝完成。
562 0
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
|
9月前
|
SQL 人工智能 数据挖掘
Apache Doris + MCP:Agent 时代的实时数据分析底座
数据不再是静态的存储对象,而是流动的智能资源;数据库不再是单纯的存储系统,而是智能化的服务平台。Apache Doris 以其在 AI 方向的深度布局和技术创新,正在成为连接数据与智能的重要桥梁。
1725 0
Apache Doris + MCP:Agent 时代的实时数据分析底座
|
8月前
|
存储 人工智能 Apache
ApacheCon 2025中国开源年度报告:Apache Doris 国内第一
在 Apache 基金会管理的近 300 个顶级项目中,Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。
447 0

热门文章

最新文章

推荐镜像

更多
下一篇
开通oss服务