文档备案控制台

Spark

# Spark #

1 关注

9137内容

最新热门文章问答电子书课程

SelectDB

|

2月前

|

博文

|

来自：云原生

基于 SelectDB 实现 Hive 数据湖统一分析：洋钱罐全球一体化探索分析平台升级实践

瓴岳科技原数据平台基于 Hive 与 StarRocks、Spark 多引擎协同架构，随着数据规模增长，在性能与易用性上逐渐面临瓶颈。通过引入阿里云 SelectDB，构建湖仓一体化探索分析平台，在无需迁移数据的前提下实现对 Hive 数据湖的透明加速，显著提升查询性能并简化架构，完成从多引擎协同向统一分析平台的升级。

# SQL # 缓存 # 分布式计算 # HIVE # Spark

阿里云大数据

|

2月前

|

博文

|

来自：大数据与机器学习

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升，在迁移到 EMR Serverless Spark 之后，TCO 明显下降，平台按作业生命周期弹性拉起与回收，只为实际消耗付费；同时，托管化带来了稳定性与调度效率提升；更关键的是交付确定性提升，大作业整体可提速约 1 小时，报表链路从长尾波动变成更可控的出数节奏。

# 开源大数据平台 E-MapReduce # 存储 # 分布式计算 # 运维 # Serverless # Spark

阿里云大数据

|

2月前

|

博文

|

来自：大数据与机器学习

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求，采用阿里云 EMR Serverless Spark 构建云原生大数据架构，迁移后实现计算加速50%，核心链路产出时间提前1.5h，研发效率和稳定性显著提升！

# 开源大数据平台 E-MapReduce # SQL # 分布式计算 # Serverless # 调度 # Spark

阿里云大数据

|

2月前

|

博文

|

来自：大数据与机器学习

EMR Serverless Spark 携手 PAI/百炼，开启“SQL 即 AI”的新篇章

EMR Serverless Spark 深度集成 AI Function 能力，并无缝对接阿里云百炼与阿里云人工智能平台 PAI 模型在线服务 PAI-EAS，定义了“SQL 即 AI”的新解决思路，数据分析师只需一行 SQL，即可直接调用世界顶尖的大模型。

# 开源大数据平台 E-MapReduce # SQL # 人工智能 # 分布式计算 # Serverless # Spark

Echo_Wish

|

3月前

|

博文

|

来自：大数据与机器学习

你还在手动发包？容器镜像一上，大数据部署直接“起飞”！

你还在手动发包？容器镜像一上，大数据部署直接“起飞”！

# 分布式计算 # 大数据 # 流计算 # Spark # 容器

hf20012-33800

|

3月前

|

博文

技术深度报道：解析云器Lakehouse如何实现超越Spark 10倍性能提升

云器科技2024年末发布TPC-DS 10TB基准测试报告，Lakehouse引擎性能达Spark的10倍。核心源于四大技术：C++向量化引擎（3×）、Cascades成本优化器（2×）、DAG直连调度（1.3×）与自适应缓存（1.3×），实现全栈协同优化。（239字）

# 缓存 # 分布式计算 # 调度 # Spark # C++

Echo_Wish

|

3月前

|

博文

|

来自：大数据与机器学习

别再手写运维脚本了：Operator 才是数据平台的“自动驾驶系统”

别再手写运维脚本了：Operator 才是数据平台的“自动驾驶系统”

# 运维 # 分布式计算 # 自动驾驶 # 流计算 # Spark

Echo_Wish

|

3月前

|

博文

|

来自：大数据与机器学习

三朵云的大数据江湖：AWS、GCP、Azure 托管服务到底谁更香？

三朵云的大数据江湖：AWS、GCP、Azure 托管服务到底谁更香？

# SQL # 分布式计算 # 大数据 # Hadoop # Spark

Echo_Wish

|

3月前

|

博文

|

来自：大数据与机器学习

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

# 容器服务Kubernetes版 # 分布式计算 # Kubernetes # Spark # 流计算 # 容器

Echo_Wish

|

3月前

|

博文

|

来自：大数据与机器学习

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

# 运维 # 分布式计算 # Cloud Native # 大数据 # Spark

1

2

3

4

...

20

免费试用