Apache

首页 标签 Apache
# Apache #
关注
28745内容
|
17天前
|
云上数据安全新范式:Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据
本文介绍了 Apache Doris 基于 AWS IAM Assume Role 的无密钥访问能力,解决传统 AK/SK 长期暴露、权限难控与审计困难等问题。通过临时令牌与最小权限机制,Doris 能安全访问 S3 并在 FE/BE 扩容时自动校验角色绑定,全面支持 Load、TVF、Export 等场景。
|
18天前
|
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
|
18天前
|
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
|
18天前
|
字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践
随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:**能否构建一款「AI + Data」一站式融合的数据引擎?** 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处理与 AI 模型无缝衔接,并能确保数据处理负载与在线服务负载完全隔离。这是 2024 年末启动 DataMind 项目的初衷。
Apache DolphinScheduler 数据库模式深度解析:从表结构到调度逻辑
Apache DolphinScheduler 作为开源分布式工作流调度平台,其数据库模式是核心支撑。本文从表结构、模块设计到企业实践,解析如何通过七大表组与分布式架构,实现跨集群调度、高可用与插件扩展,助力3000+企业高效管理数据任务,推动云原生时代下的智能调度演进。(238字)
|
21天前
|
JK2连接器使用教程:jakarta-tomcat-connectors-jk2-src-current.zip 安装配置步骤详解
`jakarta-tomcat-connectors-jk2-src-current.zip` 是 Apache 与 Tomcat 通信的 JK2 连接器源码包。需解压后进入 `native2` 目录,使用 JDK、gcc、Ant 等工具编译生成 `mod_jk2.so` 模块,再配置 Apache 加载该模块,并通过 `workers2.properties` 指定转发规则,连接运行 AJP 协议(默认 8009 端口)的 Tomcat 实现请求代理。
Delta Join:为超大规模流处理实现计算与历史数据解耦
Delta Join(FLIP-486)是Flink流式Join的范式革新,通过将历史数据存储与计算解耦,实现按需查询外部存储(如Fluss、Paimon),避免状态无限增长。它解决了传统Join在高基数场景下的状态爆炸问题,显著降低资源消耗:状态减少50TB,成本降10倍,Checkpoint从小时级缩短至秒级,恢复速度提升87%。兼容标准SQL,自动优化转换,适用于海量数据实时关联场景,推动流处理迈向高效、稳定、可扩展的新阶段。
|
23天前
|
Delta Join:为超大规模流处理实现计算与历史数据解耦
Delta Join(FLIP-486)是Flink流式Join的范式革新,通过将计算与历史数据解耦,避免传统Join因存储全量状态导致的资源爆炸。它采用无状态查询机制,按需从Fluss或Paimon等外部存储获取数据,显著降低状态大小、Checkpoint时间及恢复成本。实测中消除50TB状态,资源消耗降10倍,CPU内存节省超80%,作业恢复提速87%。兼容标准SQL,自动优化转换,适用于高基数流式关联、实时审计等场景,标志着大规模流处理进入高效稳定新阶段。
|
23天前
|
Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器
在数据库系统的核心层,查询优化器如同一位精明的策略家,不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库,其优化器内置的 Data Trait 分析机制,通过挖掘数据内在的统计特征和语义约束,为查询优化提供了基础设施。让我们一起来探索这个强大的功能!
字节推出VeAgentBench + veADK,打造可评估、可复现的智能体开发新范式
字节跳动推出VeAgentBench与veADK,打造智能体“开发-评估”闭环。VeAgentBench是覆盖教育、金融、法律等四大场景的开源评估基准,veADK为高效易用的开发框架,支持工具调用、RAG与记忆管理,助力AI智能体可度量、可复现、可落地。
免费试用