Apache Doris 2.1.8 版本正式发布

简介: 该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。

亲爱的社区小伙伴们,Apache Doris 2.1.8 版本已于 2025 年 01 月 24 日正式发布。 该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。

行为变更

  • 添加环境变量 SKIP_CHECK_ULIMIT 以跳过 BE 进程内关于 ulimit 值校验检查,仅适用于 Docker 快速启动场景中应用。#45267
  • 添加 enable_cooldown_replica_affinity session 变量控制冷热分层下查询选用副本亲和性
  • FE 添加配置restore_job_compressed_serializationbackup_job_compressed_serialization 用于解决 db tablet 数量非常大情况下备份和恢复操作时 FE OOM 的问题,打开之后无法降级

新功能

  • 查询执行引擎:Arrowflight 协议支持通过负载均衡设备访问 BE。 #43281
  • 其他:当前 Lambda 表达式支持捕获外部的列。 #45186

改进提升

湖仓一体

  • Hudi 版本更新至 0.15,并且优化了 Hudi 表的查询规划性能。
  • 优化了 MaxCompute 分区表的读取性能。 #45148
  • 支持会话变量 enable_text_validate_utf8,可以忽略 CSV 格式中的 UTF8 编码检测。#45537
  • 优化在高过滤率情况下,Parquet 文件延迟物化的性能。#46183

异步物化视图

  • 现在支持手动刷新异步物化视图中不存在的分区。#45290
  • 优化了透明改写规划的性能。#44786

查询优化器

  • 提升了 Runtime Filter 的自适应能力。#42640
  • 增加了在 MAX / MIN 聚合函数列上的过滤条件生成原始列过滤条件的能力。#39252
  • 增加了在连接谓词上抽取单测过滤条件的能力。#38479
  • 优化了谓词推导在集合算子上的能力,可以更好的生成过滤谓词。#39450
  • 优化了统计信息收集和使用的异常处理能力,避免在收集异常时产生非预期的执行计划。#43009 #43776 #43865 #42104 #42399 #41729

查询执行引擎

  • Resource group 支持在当前 group 不可用的时候,降级到别的 Group. #44255
  • 优化带 limit 的查询执行使其能够更快的结束,避免多余的数据扫描。#45222

存储管理

  • CCR 支持了更加全面的操作,比如 Rename Table,Rename Column,Modify Comment,Drop View,Drop Rollup 等。
  • 提升了 Broker Load 导入进度的准确性和多个压缩文件导入时的性能。
  • 改进了 Routine Load 超时策略、线程池使用以防止 Routine Load 超时失败和影响查询。

其他

  • Docker 快速启动镜像支持不设置环境参数直接启动,添加环境变量 SKIP_CHECK_ULIMIT 以跳过 start_be.sh 脚本以及 BE 进程内关于 swapmax_map_countulimit 相关校验检查,仅适用于 Docker 快速启动场景中应用。#45269
  • 新增 LDAP 配置型 ldap_group_filter 用于自定义 Group 过滤。#43292
  • 优化了使用 Ranger 时的性能。#41207
  • 修复审计日志中,scan bytes 统计不准的问题。#45167
  • 在 COLUMNS 系统表中能够正确显示列的默认值。#44849
  • 在 VIEWS 系统表中能够正确显示视图的定义。#45857
  • 当前,admin 用户不能被删除。#44751

Bug 修复

湖仓一体

  • Hive

    • 修复无法查询 Spark 创建的 Hive 视图的问题。#43553

    • 修复无法正确读取某些 Hive Transaction 表的问题。#45753

    • 修复 Hive 表分区存在特殊字符时,无法进行正确分区裁剪的问题。#42906

  • Iceberg

    • 修复在 Kerberos 认证环境下,无法创建 Iceberg 表的问题。#43445

    • 修复某些情况下,Iceberg 表存在 dangling delete 情况下,count(*) 查询不准确的问题。#44039

    • 修复某些情况下,Iceberg 表列名不匹配导致查询错误的问题#44470

    • 修复某些情况下,当 Iceberg 表分区被修改后,无法读取的问题#45367

  • Paimon

    • 修复 Paimon Catalog 无法访问阿里云 OSS-HDFS 的问题。#42585
  • Hudi

    • 修复某些情况下,Hudi 表分区裁剪失效的问题。#44669
  • JDBC

    • 修复某些情况下,开始表名大小写不敏感功能后,使用 JDBC Catalog 无法获取表的问题。
  • MaxCompute

    • 修复某些情况下,MaxCompute 表分区裁剪失效的问题。#44508
  • 其他

    • 修复某些情况下,Export 任务导致 FE 内存泄露的问题。#44019

    • 修复某些情况下,无法使用 HTTPS 协议访问 S3 对象存储的问题。#44242

    • 修复某些情况下,Kerberos 认证票据无法自动刷新的问题。#44916

    • 修复某些情况下,读取 Hadoop Block 压缩格式文件出错的问题。#45289

    • 查询 ORC 格式的数据时,不再下推 CHAR 类型的谓词,以避免可能的结果错误。#45484

异步物化视图

  • 修复了当物化视图定义中存在 CTE 时,无法刷新的问题。#44857
  • 修复了当基表增加列后,异步物化视图不能命中透明改写的问题。#44867
  • 修复了当查询中在不同位置包含相同的过滤谓词时,透明改写失败的问题。#44575
  • 修复了当过滤谓词或连接谓词中使用列的别名时,无法透明改写的问题。#44779

索引

  • 修复倒排索引 Compaction 异常处理的问题 #45773
  • 修复倒排索引构建因为等锁超时失败的问题 #43589
  • 修复异常情况下倒排索引写入 Crash 的问题。#46075
  • 修复 Match 函数特殊参数时空指针的问题 #45774
  • 修复 VARIANT 倒排索引相关的问题,禁用 VARIANT 使用索引 v1 格式。#43971 #45179

  • 修复 NGram Bloomfilter Index 设置 gram_size = 65535 时 Crash 的问题。#43654

  • 修复 Bloomfilter Index 计算 DATE 和 DATETIME 不对的问题。#43622
  • 修复 Drop Coloumn 没有自动 Drop Bloomfilter Index 的问题。#44478
  • 减少 Bloomfilter Index 写入时的内存占用。#46047

半结构化数据类型

  • 优化内存占用,降低 VARIANT 数据类型的内存消耗。#43349 #44585 #45734
  • 优化 VARIANT Schema Copy 性能。#45731
  • 自动推断 Tablet Key 时不将 VARIANT 作为 Key。#44736
  • 修复 VARIANT 从 NOT NULL 改成 NULL 的问题。#45734
  • 修复 Lambda 函数类型推断错误的问题。#45798
  • 修复 ipv6_cidr_to_range 函数边界条件 Coredump。#46252

查询优化器

  • 修复了潜在的表读锁互斥导致的死锁问题,并优化了锁的使用逻辑#45045 #43376 #44164 #44967 #45995
  • 修复了 SQL Cache 功能错误的使用常量折叠导致在使用包含时间格式的函数时结果不正确的问题。#44631
  • 修复了比较表达式优化,在边缘情况下可能优化错误,导致结果不正确的问题。#44054 #44725 #44922 #45735 #45868
  • 修复高并发点查审计日志不正确的问题。 #43345 #44588
  • 修复高并发点查遇到异常后持续报错的问题。#44582
  • 修复部分字段 Prepared Statement 不正确的问题。#45732

查询执行引擎

  • 修复了正则表达式和 LIKE 函数在特殊字符时结果不对的问题。#44547
  • 修复 SQL Cache 在切换 DB 的时候结果可能不对的问题。#44782
  • 修复cut_ipv6 函数结果不对的问题。#43921
  • 修复数值类型到 bool 类型 cast 的问题。#46275
  • 修复了一系列 Arrow Flight 相关的问题。#45661 #45023 #43960 #43929
  • 修复了当 hashjoin 的 hash 表超过 4G 时,部分情况结果错误的问题。#46461
  • 修复了 convert_to 函数在中文字符时溢出的问题。#46505

存储管理

  • 修复高并发 DDL 可能导致 FE 启动失败的问题。
  • 修复自增列可能出现重复值的问题。
  • 修复扩容时 Routine Load 不能使用新扩容 BE 的问题。

权限管理

  • 修复使用 Ranger 作为鉴权插件时,频繁访问 Ranger 服务的问题#45645

Others

  • 修复 BE 端开启 enable_jvm_monitor=true 后可能导致的内存泄露问题。[#44311](
目录
相关文章
|
6月前
|
消息中间件 OLAP Kafka
Apache Doris 实时更新技术揭秘:为何在 OLAP 领域表现卓越?
Apache Doris 为何在 OLAP 领域表现卓越?凭借其主键模型、数据延迟、查询性能、并发处理、易用性等多方面特性的表现,在分析领域展现了独特的实时更新能力。
611 9
|
5月前
|
存储 自然语言处理 分布式计算
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
Apache Doris 3.1 正式发布!全面升级半结构化分析,支持 VARIANT 稀疏列与模板化 Schema,提升湖仓一体能力,增强 Iceberg/Paimon 集成,优化存储引擎与查询性能,助力高效数据分析。
737 4
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
|
6月前
|
存储 分布式计算 Apache
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
小米通过将 Apache Doris(数据库)与 Apache Paimon(数据湖)深度融合,不仅解决了数据湖分析的性能瓶颈,更实现了 “1+1>2” 的协同效应。在这些实践下,小米在湖仓数据分析场景下获得了可观的业务收益。
1152 9
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
|
5月前
|
SQL 人工智能 数据挖掘
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
Apache Doris 4.0 原生集成 LLM 函数,将大语言模型能力深度融入 SQL 引擎,实现文本处理智能化与数据分析一体化。通过十大函数,支持智能客服、内容分析、金融风控等场景,提升实时决策效率。采用资源池化管理,保障数据一致性,降低传输开销,毫秒级完成 AI 分析。结合缓存复用、并行执行与权限控制,兼顾性能、成本与安全,推动数据库向 AI 原生演进。
444 0
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
|
6月前
|
人工智能 运维 监控
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
本文基于 Apache Doris 数据运维治理 Agent 展开讨论,如何让 AI 成为 Doris 数据运维工程师和数据治理专家的智能助手,并在某些场景下实现对人工操作的全面替代。这种变革不仅仅是技术层面的进步,更是数据运维治理思维方式的根本性转变:从“被动响应”到“主动预防”,从“人工判断”到“智能决策”,从“孤立处理”到“协同治理”。
1034 11
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
|
6月前
|
SQL 存储 运维
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
本文介绍了 Apache Doris 在菜鸟的大规模落地的实践经验,菜鸟为什么选择 Doris,以及 Doris 如何在菜鸟从 0 开始,一步步的验证、落地,到如今上万核的规模,服务于各个业务线,Doris 已然成为菜鸟 OLAP 数据分析的最优选型。
420 2
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
|
6月前
|
SQL 存储 JSON
Apache Doris 2.1.10 版本正式发布
亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
289 5
|
6月前
|
人工智能 自然语言处理 数据挖掘
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
在即将发布的 Apache Doris 4.0 版本中,我们正式引入了一系列 LLM 函数,将前沿的 AI 能力与日常的数据分析相结合,无论是精准提取文本信息,还是对评论进行情感分类,亦或生成精炼的文本摘要,皆可在数据库内部无缝完成。
456 0
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
|
7月前
|
SQL 人工智能 数据挖掘
Apache Doris + MCP:Agent 时代的实时数据分析底座
数据不再是静态的存储对象,而是流动的智能资源;数据库不再是单纯的存储系统,而是智能化的服务平台。Apache Doris 以其在 AI 方向的深度布局和技术创新,正在成为连接数据与智能的重要桥梁。
1514 0
Apache Doris + MCP:Agent 时代的实时数据分析底座
|
6月前
|
存储 人工智能 Apache
ApacheCon 2025中国开源年度报告:Apache Doris 国内第一
在 Apache 基金会管理的近 300 个顶级项目中,Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。
363 0

推荐镜像

更多