霖玉

2023-06-15

大数据SQL数据倾斜与数据膨胀的优化与经验总结

目前市面上大数据查询分析引擎层出不穷，但在业务使用过程中，大多含有性能瓶颈的SQL，主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化，尝试给出相对系统性的解决方案。

霖玉

13,359

扬流

2024-05-15

118098

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,098

言澈

2024-05-15

407

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

407

阿里云实时数仓Hologres

2024-06-27

72289

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

72,289

玄飏

2024-07-04

36644

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

36,644

阿里云大数据Al技术

2024-08-09

8182

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

8,182

阿里云云原生

2024-08-21

606

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

606

ModelScope

2024-05-15

247

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

247

阿里云存储

2024-07-16

19530

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

19,530

类目筛选

内容类型

大数据SQL数据倾斜与数据膨胀的优化与经验总结

Paimon 与 Spark 的集成（二）：查询优化

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

Hologres+Flink企业级实时数仓核心能力介绍

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

基于RAG搭建企业级知识库在线问答

用好通义灵码，让这款 AI 编码助手帮你做更多工作

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

几百T的视频、图片数据进行更有效地存储和管理