Spark的搜索结果_第4页-阿里云开发者社区

hf20012-33800

|

5月前

|

博文

云器科技2024年末发布TPC-DS 10TB基准测试报告，Lakehouse引擎性能达Spark的10倍。核心源于四大技术：C++向量化引擎（3×）、Cascades成本优化器（2×）、DAG直连调度（1.3×）与自适应缓存（1.3×），实现全栈协同优化。（239字）

# 缓存 # 分布式计算 # 调度 # Spark # C++

数据库知识分享者小北

|

5月前

|

电子书

|

来自：数据库

OpenClaw「虾搞」数据库-杭州钳力场

在真实的企业级生产环境里，OpenClaw 到底能干嘛？是只会写两行 SQL 的“聊天机器人”，还是能真正钳住慢 SQL、自动巡检、搞定索引修复的“超级 DBA”？本场分享，我们玩企业级实战。将龙虾从“能跑”走向“敢用”，从“开源项目”迈向“企业基础设施”！

# 云原生数据库 PolarDB # 云数据库 RDS MySQL 版 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云数据库 RDS # 数据管理 # 数据采集 # 数据处理 # BI # 数据可视化 # 数据管理 # 云计算 # OLTP # OLAP # 关系型数据库 # 数据库 # 架构师 # 开发者 # 程序员 # 大数据 # 数据挖掘 # 数据格式 # DataWorks # Spark # HIVE # BeeHive # 流计算 # Hadoop # 分布式计算 # 数据建模 # MaxCompute # DataX

Echo_Wish

|

5月前

|

博文

|

来自：大数据与机器学习

别再手写运维脚本了：Operator 才是数据平台的“自动驾驶系统”

# 运维 # 分布式计算 # 自动驾驶 # 流计算 # Spark

Echo_Wish

|

5月前

|

博文

|

来自：大数据与机器学习

三朵云的大数据江湖：AWS、GCP、Azure 托管服务到底谁更香？

# SQL # 分布式计算 # 大数据 # Hadoop # Spark

Echo_Wish

|

5月前

|

博文

|

来自：大数据与机器学习

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

# 容器服务Kubernetes版 # 分布式计算 # Kubernetes # Spark # 流计算 # 容器

Echo_Wish

|

5月前

|

博文

|

来自：大数据与机器学习

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

# 运维 # 分布式计算 # Cloud Native # 大数据 # Spark

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

数据湖上跑模型训练？别再“豪横烧钱”了，这样优化性能和成本才靠谱

# 存储 # 分布式计算 # Apache # 对象存储 # Spark

vd6jcpp2zzci2

|

6月前

|

博文

Spark SQL练习2-电商用户行为分析

“**商城”电商平台需基于用户行为数据开展深度分析：一是计算用户活跃度趋势（含活跃天数、变化率及四类用户分层）；二是构建RFM价值分层模型，量化R/F/M得分并划分高价值、潜力等四类用户；三是识别流失风险用户，分析其浏览时长变化与偏好品类。支撑精细化运营与精准营销。

# SQL # 分布式计算 # 搜索推荐 # Spark

sysin

|

6月前

|

博文

Cisco Expressway Release X15.4.0 - 统一通信网关

# 分布式计算 # 网络安全 # 虚拟化 # 网络虚拟化 # Spark

vd6jcpp2zzci2

|

6月前

|

博文

|

来自：大数据与机器学习

PySpark入门教程（非常详细）从零基础入门到精通

本教程聚焦Spark Core核心原理，基于3.5.8版本，用Python详解RDD五大特性（分区、计算函数、依赖关系、分区器、首选位置）、容错机制、Shuffle、DAG调度及共享变量等，并通过WordCount实战演示。

# 存储 # 分布式计算 # Java # Spark # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark