昕羽

2024-05-15

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,064

怀潜

2023-05-10

2398

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

2,398

豁朗

2024-05-15

125315

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

豁朗

125,315

瑞丹

2024-05-15

115

跨节点参数的缘起与今生

Dataphin v3.13引入了跨节点参数功能，允许任务间传递消息。输出节点（如SQL、Shell、Python任务）能输出参数，输入节点可以接收并使用这些参数。此功能解决了通过公共存储中转消息的复杂性和低效问题。应用场景包括：金融企业的币种转换，其中汇率任务（输出节点）提供汇率，转换任务（输入节点）使用该汇率；以及产品目录更新检查，通过跨节点参数控制是否需要执行数据导入任务。用户可以通过任务编辑器设置和传递跨节点参数，并在运维中进行补数据操作。

瑞丹

115

栾枝

2023-07-18

130387

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

130,387

非有

2024-05-15

860

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

860

豁朗

2024-05-15

83

试试这套轻量级低成本自建数据库的审计方案

本文主要介绍使用日志服务借助开源工具来搭建一套轻量级低成本的数据库审计方案。

豁朗

83

元乙

2024-05-15

61122

面向全栈可观测的分布式链路追踪

全栈可观测App提供了一套完整的分析工具，从数据统计分析能力到数据关联，再到具备智能化和自动化特性的相关工具，以解决人们在可观测性方面所遇到的问题。未来，我们将持续提供更加丰富和强大的分析工具来满足用户的需求。

元乙

61,122

抱泽

2024-05-15

77

Kubernetes 文件采集实践：Sidecar + hostPath 卷

在Kubernetes 日志查询分析实践中，我们介绍了如何通过 DaemonSet 方式部署 logtail 并采集标准输出/文件两种形式的数据。DaemonSet 部署的优势在于其能够尽可能地减少采集 agent 所占用的资源且支持标准输出采集，但因为每个 DaemonSet pod 需要负责 n...

抱泽

77

类目筛选

内容类型

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Hologres+大模型初探，让ChatGPT回答商家问题

弱结构化日志 Flink SQL 怎么写？SLS SPL 来帮忙

跨节点参数的缘起与今生

手把手教你使用OSS-HDFS服务平替自建HDFS

一文详解 Java 限流接口实现

试试这套轻量级低成本自建数据库的审计方案

面向全栈可观测的分布式链路追踪

Kubernetes 文件采集实践：Sidecar + hostPath 卷