大数据

首页 标签 大数据
# 大数据 #
关注
49072内容
【赵渝强老师】基于Hudi的大数据湖仓一体架构
Apache Hudi(Hadoop Upserts Delete and Incremental)是开源的流式数据湖平台,支持事务、高效upsert/delete、增量处理、多引擎SQL读写(Spark/Flink/Trino等),自动管理小文件与压缩,兼容云存储,助力构建湖仓一体架构。
|
16天前
|
用Pandas快速找出重复数据并生成清理报告:从原理到实战的完整指南
本文详解Pandas处理数据重复的实战方法:从完全重复、关键字段重复的识别,到duplicated()检测、智能去重(如保留最高金额)、可视化分析及自动化清理报告生成,覆盖检测、清理、验证、报告全流程,助你将数据清洗变为可控、可溯、可证的工程实践。(239字)
PL/pgSQL 入门教程(四):使用游标(cursor)
游标是PostgreSQL中“按需取数”的数据指针,避免大查询内存溢出;支持逐行处理、动态查询、精准更新/删除及函数返回大结果集。分未绑定(灵活)与绑定(固定)两类,核心操作为声明→打开→FETCH/MOVE/UPDATE→关闭,FOR循环可自动简化遍历。
|
17天前
|
2025年新版阿里云服务器配置价格表及相关活动信息整理说明
2026年阿里云服务器价格及相关活动信息总结。 1、2026年阿里云轻量应用服务器价格表。 2、2026年阿里云ECS云服务器价格表。 3、2026年阿里云GPU云服务器价格表。
阿里云轻量服务器38元1年,与云服务器ECS对比有何不同,区别及选择参考
在阿里云的云服务器产品中,轻量应用服务器和ECS云服务器是两款备受关注的产品。目前,阿里云针对轻量应用服务器推出了一系列优惠活动,价格非常优惠,轻量云服务器2核2G200M峰值带宽38元一年。那么,轻量应用服务器与ECS云服务器相比有何不同,又该如何选择呢?本文为大家介绍他们之间的不同,以供选择参考。
免费试用