SelectDB_个人页

SelectDB
个人头像照片
163
0
2

个人介绍

基于 Apache Doris 的云原生实时数据仓库,致力于为客户提供极致性能、简单易用的数据分析服务。 加入钉钉交流群:87535000468

擅长的技术

  • 数据库
  • 数据处理
  • BI
  • 数据建模
  • 数据可视化
  • OLAP
  • 运维
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年12月

  • 12.04 16:31:18
    发表了文章 2025-12-04 16:31:18

    Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive

    本文档将作为一份官方指南,系统性地阐述 Apache Doris 的数据更新能力,内容涵盖其核心原理、多样的更新与删除方式、典型的应用场景,以及在不同部署模式下的性能最佳实践,旨在帮助您全面掌握并高效利用 Doris 的数据更新功能。
  • 12.03 11:43:08
    发表了文章 2025-12-03 11:43:08

    云上数据安全新范式:Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据

    本文介绍了 Apache Doris 基于 AWS IAM Assume Role 的无密钥访问能力,解决传统 AK/SK 长期暴露、权限难控与审计困难等问题。通过临时令牌与最小权限机制,Doris 能安全访问 S3 并在 FE/BE 扩容时自动校验角色绑定,全面支持 Load、TVF、Export 等场景。
  • 12.02 21:13:26
    发表了文章 2025-12-02 21:13:26

    Apache Doris 在小米统一 OLAP 和湖仓一体的实践

    小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
  • 12.02 21:11:36
    发表了文章 2025-12-02 21:11:36

    Apache Doris 在小米统一 OLAP 和湖仓一体的实践

    小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
  • 12.02 20:18:23
    发表了文章 2025-12-02 20:18:23

    字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践

    随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:**能否构建一款「AI + Data」一站式融合的数据引擎?** 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处理与 AI 模型无缝衔接,并能确保数据处理负载与在线服务负载完全隔离。这是 2024 年末启动 DataMind 项目的初衷。

2025年11月

  • 11.27 10:26:03
    发表了文章 2025-11-27 10:26:03

    Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

    在数据库系统的核心层,查询优化器如同一位精明的策略家,不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库,其优化器内置的 Data Trait 分析机制,通过挖掘数据内在的统计特征和语义约束,为查询优化提供了基础设施。让我们一起来探索这个强大的功能!
  • 11.26 15:43:26
    发表了文章 2025-11-26 15:43:26

    更高效的数据处理解决方案:基于 MinIO 部署 Apache Doris 存算分离版本实践

    现代数据处理在多维度面临严峻挑战,一方面,数据量的持续增长致使传统存储成本居高不下,非结构化数据所占比例日益攀升,进一步加重了存储负担,且数据质量问题推高了存储和清洗成本;另一方面,企业内部往往存在多套系统,数据难以集成,这对数据分析的成本和时效性也提出了更高的要求。Apache Doris 作为一款具备高性能的实时分析数据库,拥有湖仓一体的能力。当它与 MinIO 这样高性能且 S3 兼容的对象存储系统相结合时,能够构建出一个高效且具备低成本特性的数据分析系统。本文将介绍基于 Apache Doris 和 MinIO 的存算分离部署教程与使用实践。
  • 11.25 19:58:51
    发表了文章 2025-11-25 19:58:51

    从 OpenSearch 到 Apache Doris:领创集团日志系统升级实践,降本 45

    随着业务全球化扩展与数字化运营的深入推进,日志系统的规模和复杂度不断攀升,原有基于 OpenSearch 的日志平台逐渐难以满足成本控制、性能保障和可维护性等多维需求。为应对持续增长的数据压力和更灵活的分析场景,领创集团技术团队启动了日志系统的架构升级实践,并最终选择 Apache Doris 作为新一代日志系统的核心。实现了综合成本下降超 45%、查询性能提升 5 倍、日志写入达到准实时以及灵活的运维策略等一系列显著收益。
  • 11.25 16:15:19
    发表了文章 2025-11-25 16:15:19

    压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive

    本文基于 ClickBench 数据集,展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终,相同数据集的压缩空间从 16.08 GB 降至 8.2 GB,压缩率提升 48.6%。通过合理的调整与优化,Doris 成功在保持查询性能的同时显著降低了存储成本。
  • 11.24 18:59:24
    发表了文章 2025-11-24 18:59:24

    深入理解 Doris Variant:如何让 JSON 查询性能追平列存,还能承载万列索引字段?|Deep Dive

    在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中,对于 JSON 的处理往往面临灵活性及性能无法兼得的困境,而 Apache Doris 的 VARIANT 类型,通过动态子列、稀疏列存储、延迟物化和路径索引等能力,实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解,全面展示其优势。
  • 11.19 23:32:53
    发表了文章 2025-11-19 23:32:53

    为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍

    企业数据分析能力从TP系统起步,随业务发展历经扩展优化,最终走向AP系统独立建设。Apache Doris凭借高并发、低延迟、实时更新与强查询性能,成为实时分析架构升级的理想选择,助力网易云音乐、快手、拉卡拉等企业实现性能倍增与成本优化。
  • 11.19 22:31:49
    发表了文章 2025-11-19 22:31:49

    Apache Doris 登顶 RTABench —— 实时分析领域的性能王者

    Apache Doris 在最新 RTABench 实时分析榜单中登顶,性能达 ClickHouse 的6倍、PostgreSQL 的30倍、MongoDB 的100倍。依托 MPP 架构、列式存储、Pipeline 引擎与智能优化器,Doris 在多表关联、实时查询等场景表现卓越,成为实时分析新标杆。
  • 11.19 22:17:10
    发表了文章 2025-11-19 22:17:10

    Apache Doris 是如何保障系统稳定性的?

    Apache Doris 面对多样化场景与高速迭代,构建了涵盖单元测试、混沌测试、升降级验证等多维测试体系,并通过工程实践、社区共建、系统重构与文档建设四大支柱,打造全方位稳定性保障体系,持续提升系统可靠性。
  • 11.19 21:32:53
    发表了文章 2025-11-19 21:32:53

    Doris MCP Server 0.5.1 版本发布

    Doris MCP Server 0.5.1 升级发布,增强全局SQL超时、自愈连接池,新增数据治理八项能力,支持ADBC协议提速3-10倍,升级日志系统与调参文档,兼容0.4.x版本,助力企业高效稳定数据分析。
  • 11.18 21:43:48
    发表了文章 2025-11-18 21:43:48

    货拉拉用户画像基于 Apache Doris 的数据模型设计与实践

    货拉拉基于Apache Doris构建高效用户画像系统,实现标签管理、人群圈选与行为分析的统一计算引擎,支持秒级响应与大规模数据导入,显著提升查询效率与系统稳定性,助力实时化、智能化运营升级。
  • 11.18 21:37:55
    发表了文章 2025-11-18 21:37:55

    Apache Doris 4.0 版本正式发布:全面升级 AI 与搜索能力,强化离线计算

    Apache Doris 4.0 正式发布!深度融合AI与搜索能力,支持向量索引、AI函数、全文检索打分,强化离线计算稳定性,提升查询性能与数据质量,助力企业构建高效实时数仓。
  • 11.18 21:21:58
    发表了文章 2025-11-18 21:21:58

    从 Snowflake 到 Apache Doris:Planet 实时分析成本直降 80%、查询加速 90 倍

    Planet深耕支付与税务数字化近40年,服务全球零售、酒店与旅游行业。为应对数据增长挑战,其数据团队将数仓从Snowflake迁移至Apache Doris,实现月成本降低80%、查询性能提升最高90倍,并达成实时分析能力,构建了高效、低成本、可扩展的数据新架构,为业务发展奠定坚实基础。
  • 11.18 21:05:27
    发表了文章 2025-11-18 21:05:27

    Doris MCP Server v0.6.0 正式发布

    Doris MCP Server v0.6.0 重磅发布!全面升级为企业级认证与数据库管理系统,支持多租户隔离、Token绑定配置、热重载免重启、Web可视化管理。增强安全防护、连接池性能飞跃,助力多租户SaaS与高可用生产环境,平滑兼容旧版本,开启数据管理新时代。
  • 11.18 20:57:39
    发表了文章 2025-11-18 20:57:39

    Apache Doris 数据导入原理与性能优化 | Deep Dive

    Apache Doris 数据导入机制基于分布式架构,通过 FE 与 BE 协同实现高效、可靠的数据写入。本文深入解析其核心流程、事务管理与性能瓶颈,涵盖 Stream Load、Broker Load 等多种导入方式,重点剖析 MemTable 前移、存算分离优化等关键技术,并提供表结构设计、攒批策略、分桶配置等实战优化方案,帮助用户在延迟与吞吐间取得平衡,显著提升数据导入效率。
  • 11.18 20:52:17
    发表了文章 2025-11-18 20:52:17

    Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析

    Apache Doris 推出 AI_AGG 与 EMBED 两大核心函数,实现文本智能聚合与语义向量化分析。AI_AGG 支持海量文本动态预聚合,EMBED 结合向量函数实现相似度检索、问答匹配等场景,原生集成 AI 能力至 SQL,让数据分析更智能高效。
  • 11.16 14:18:27
    发表了文章 2025-11-16 14:18:27

    Apache Doris 自动分区:如何应对分布式环境下的复杂并发挑战|Deep Dive

    在分布式环境下,分区对性能的影响不可小觑。本文深度、详尽的讲解 Apache Doris 自动分区设计思考,并就多线程复杂并发场景下所面临的挑战,一一剖析 Doris 自动分区设计时的应对策略。
  • 11.14 11:43:21
    发表了文章 2025-11-14 11:43:21

    从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效

    基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构,并广泛应用于广告系统、日志平台和会员报表分析等典型场景,导入性能提升 3~30 倍,机器成本整体降低 55%、部分场景下高达 85%,每年节省数百万成本,综合效能提升 3~7 倍等显著收益,本文将详尽介绍基于 Doris 架构升级及在这些场景中的应用实践。
  • 11.14 11:19:00
    发表了文章 2025-11-14 11:19:00

    专为 Apache Doris 打造的可视化数据管理工具 SelectDB Studio

    SelectDB Studio 提供 Desktop & Server 双版本,专注于为用户提供高效、便捷的可视化操作体验,帮助数据开发者、DBA 低门槛、高效率地对 Apache Doris 及其兼容数据库中的数据进行可视化开发和管理。

2025年10月

  • 10.14 18:44:54
    发表了文章 2025-10-14 18:44:54

    Apache Doris 与 ClickHouse:运维与开源闭源对比

    Doris 与 ClickHouse 各有优势,但在运维效率、集群自动化能力、故障恢复机制以及开源治理模型方面,Doris 展现出了更成熟、更开放、更面向云原生架构的产品能力。对于希望构建可控、弹性、高可用分析平台的团队而言,Doris 提供了一个更具确定性和长期价值的选择。而 ClickHouse 仍是极具性能优势的分析引擎,但其闭源方向的转变可能需要用户在技术与商业之间做出更谨慎的权衡。

2025年09月

  • 09.28 10:57:36
    发表了文章 2025-09-28 10:57:36

    Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践

    Apache Doris 4.0 原生集成 LLM 函数,将大语言模型能力深度融入 SQL 引擎,实现文本处理智能化与数据分析一体化。通过十大函数,支持智能客服、内容分析、金融风控等场景,提升实时决策效率。采用资源池化管理,保障数据一致性,降低传输开销,毫秒级完成 AI 分析。结合缓存复用、并行执行与权限控制,兼顾性能、成本与安全,推动数据库向 AI 原生演进。
  • 09.24 19:07:42
    发表了文章 2025-09-24 19:07:42

    Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高

    Apache Doris 3.1 正式发布!全面升级半结构化分析,支持 VARIANT 稀疏列与模板化 Schema,提升湖仓一体能力,增强 Iceberg/Paimon 集成,优化存储引擎与查询性能,助力高效数据分析。
  • 09.12 18:27:21
    发表了文章 2025-09-12 18:27:21

    爱玛集团:All In SelectDB 构建极速统一数据平台,领航 AI 数智化实践

    爱玛集团作为电动车行业的领军企业,在经过三年多的数智化转型实践,成功构建了 All In SelectDB 的统一数据平台,实现了从传统 Hadoop 多组件架构到 SelectDB 轻量级一体化平台的转变,数据处理效率提高 5-8 倍,系统稳定性显著提升。

2025年08月

  • 08.27 14:14:09
    发表了文章 2025-08-27 14:14:09

    湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃

    小米通过将 Apache Doris(数据库)与 Apache Paimon(数据湖)深度融合,不仅解决了数据湖分析的性能瓶颈,更实现了 “1+1>2” 的协同效应。在这些实践下,小米在湖仓数据分析场景下获得了可观的业务收益。
  • 08.22 18:13:37
    发表了文章 2025-08-22 18:13:37

    2-5 倍性能提升,30% 成本降低,阿里云 SelectDB 存算分离架构助力波司登集团实现降本增效

    波司登集团升级大数据架构,采用阿里云数据库 SelectDB 版,实现资源隔离与弹性扩缩容,查询性能提升 2-5 倍,总体成本降低 30% 以上,效率提升 30%,助力销售旺季高效运营。
  • 08.22 17:36:22
    发表了文章 2025-08-22 17:36:22

    谁才是多快好省的数据分析选择?

    无论是简单的 Coffee Bench Join 场景,还是贴近生产的复杂 TPC-H/TPC-DS 测试,Apache Doris 都能展现出碾压级的性能优势:在满足 OLAP 分析需求的前提下,其性能与成本的综合性价比,相较 Snowflake 和 ClickHouse 高出 5-10 倍以上。
  • 08.20 17:02:52
    发表了文章 2025-08-20 17:02:52

    智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案

    本文基于 Apache Doris 数据运维治理 Agent 展开讨论,如何让 AI 成为 Doris 数据运维工程师和数据治理专家的智能助手,并在某些场景下实现对人工操作的全面替代。这种变革不仅仅是技术层面的进步,更是数据运维治理思维方式的根本性转变:从“被动响应”到“主动预防”,从“人工判断”到“智能决策”,从“孤立处理”到“协同治理”。
  • 08.20 16:58:29
    发表了文章 2025-08-20 16:58:29

    Apache Doris 实时更新技术揭秘:为何在 OLAP 领域表现卓越?

    Apache Doris 为何在 OLAP 领域表现卓越?凭借其主键模型、数据延迟、查询性能、并发处理、易用性等多方面特性的表现,在分析领域展现了独特的实时更新能力。
  • 08.20 16:49:46
    发表了文章 2025-08-20 16:49:46

    浩瀚深度:从 ClickHouse 到 Doris, 支撑单表 13PB、534 万亿行的超大规模数据分析场景

    浩瀚深度旗下企业级大数据平台选择 Apache Doris 作为核心数据库解决方案,目前已在全国范围内十余个生产环境中稳步运行,其中最大规模集群部署于 117 个高性能服务器节点,单表原始数据量超 13PB,行数突破 534 万亿,日均导入数据约 145TB,节假日峰值达 158TB,是目前已知国内最大单表。
  • 08.20 16:48:42
    发表了文章 2025-08-20 16:48:42

    Apache Doris 2.1.10 版本正式发布

    亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
  • 08.19 20:30:24
    发表了文章 2025-08-19 20:30:24

    Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍

    在即将发布的 Apache Doris 4.0 版本中,我们正式引入了一系列 LLM 函数,将前沿的 AI 能力与日常的数据分析相结合,无论是精准提取文本信息,还是对评论进行情感分类,亦或生成精炼的文本摘要,皆可在数据库内部无缝完成。
  • 08.19 19:34:56
    发表了文章 2025-08-19 19:34:56

    Apache Doris 在菜鸟的大规模湖仓业务场景落地实践

    本文介绍了 Apache Doris 在菜鸟的大规模落地的实践经验,菜鸟为什么选择 Doris,以及 Doris 如何在菜鸟从 0 开始,一步步的验证、落地,到如今上万核的规模,服务于各个业务线,Doris 已然成为菜鸟 OLAP 数据分析的最优选型。
  • 08.07 22:19:04
    发表了文章 2025-08-07 22:19:04

    从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

    本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现,并结合 Flink CDC 详细介绍了整库同步的解决方案,助力构建更加高效、稳定的实时数据处理体系。
  • 08.07 22:08:10
    发表了文章 2025-08-07 22:08:10

    ApacheCon 2025中国开源年度报告:Apache Doris 国内第一

    在 Apache 基金会管理的近 300 个顶级项目中,Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。

2025年07月

  • 发表了文章 2025-12-04

    Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive

  • 发表了文章 2025-12-03

    云上数据安全新范式:Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据

  • 发表了文章 2025-12-02

    Apache Doris 在小米统一 OLAP 和湖仓一体的实践

  • 发表了文章 2025-12-02

    Apache Doris 在小米统一 OLAP 和湖仓一体的实践

  • 发表了文章 2025-12-02

    字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践

  • 发表了文章 2025-11-27

    Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

  • 发表了文章 2025-11-26

    更高效的数据处理解决方案:基于 MinIO 部署 Apache Doris 存算分离版本实践

  • 发表了文章 2025-11-25

    从 OpenSearch 到 Apache Doris:领创集团日志系统升级实践,降本 45

  • 发表了文章 2025-11-25

    压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive

  • 发表了文章 2025-11-24

    深入理解 Doris Variant:如何让 JSON 查询性能追平列存,还能承载万列索引字段?|Deep Dive

  • 发表了文章 2025-11-19

    为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍

  • 发表了文章 2025-11-19

    Apache Doris 登顶 RTABench —— 实时分析领域的性能王者

  • 发表了文章 2025-11-19

    Apache Doris 是如何保障系统稳定性的?

  • 发表了文章 2025-11-19

    Doris MCP Server 0.5.1 版本发布

  • 发表了文章 2025-11-18

    货拉拉用户画像基于 Apache Doris 的数据模型设计与实践

  • 发表了文章 2025-11-18

    Apache Doris 4.0 版本正式发布:全面升级 AI 与搜索能力,强化离线计算

  • 发表了文章 2025-11-18

    从 Snowflake 到 Apache Doris:Planet 实时分析成本直降 80%、查询加速 90 倍

  • 发表了文章 2025-11-18

    Doris MCP Server v0.6.0 正式发布

  • 发表了文章 2025-11-18

    Apache Doris 数据导入原理与性能优化 | Deep Dive

  • 发表了文章 2025-11-18

    Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息