昕羽

2024-05-15

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,180

梦实

2024-05-15

84214

PolarDB-X最佳实践：如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法（CO_HASH），实现高效的多维度查询。

梦实

84,214

瑞丹

2024-05-15

149

跨节点参数的缘起与今生

Dataphin v3.13引入了跨节点参数功能，允许任务间传递消息。输出节点（如SQL、Shell、Python任务）能输出参数，输入节点可以接收并使用这些参数。此功能解决了通过公共存储中转消息的复杂性和低效问题。应用场景包括：金融企业的币种转换，其中汇率任务（输出节点）提供汇率，转换任务（输入节点）使用该汇率；以及产品目录更新检查，通过跨节点参数控制是否需要执行数据导入任务。用户可以通过任务编辑器设置和传递跨节点参数，并在运维中进行补数据操作。

瑞丹

149

资源编排ROS

2024-06-04

644

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

644

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

桦雄

2024-05-15

133030

走进RDS之MySQL内存分配与管理（上）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要介绍InnoDB层和SQL层内存分配管理器，主要包括ut_allocator、mem_heap_allocator和MEM_ROOT，代码版本主要基于8.0.25。

桦雄

133,030

ModelScope

2024-05-15

354

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

354

阿里云实时数仓Hologres

2024-05-15

706

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

706

佳二

2024-05-15

124

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

本篇为系列第2篇，分享在支付宝支付数据链路改造升级过程中，针对数据倾斜的优化实践新方法，在解决数据倾斜问题的同时，还能兼顾更优的计算性能！

佳二

124

类目筛选

内容类型

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

PolarDB-X最佳实践：如何设计一张订单表

跨节点参数的缘起与今生

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

OSS数据源一站式RAG最佳实践

走进RDS之MySQL内存分配与管理（上）

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Flink+Paimon+Hologres 构建实时湖仓数据分析

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势