Spark的搜索结果_文章_第20页-阿里云开发者社区

武子康

|

博文

大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍

# 云原生大数据计算服务 MaxCompute # 存储 # 缓存 # 分布式计算 # 大数据 # Spark

武子康

|

博文

大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS

# 容器服务Kubernetes版 # 资源管理 # 云原生大数据计算服务 MaxCompute # 日志服务 # 分布式计算 # Kubernetes # Hadoop # Spark # 容器

武子康

|

博文

大数据-81 Spark 安装配置环境集群环境配置超详细三台云服务器

# 云服务器 ECS # 云原生大数据计算服务 MaxCompute # SQL # 机器学习/深度学习 # 分布式计算 # 大数据 # Spark

武子康

|

博文

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

# 资源管理 # 云原生大数据计算服务 MaxCompute # 分布式计算 # 资源调度 # Hadoop # 大数据 # Spark

威哥爱编程

|

博文

Spark任务OOM问题如何解决？

大家好，我是V哥。在实际业务中，Spark任务常因数据量过大、资源分配不合理或代码瓶颈导致OOM（Out of Memory）。本文详细分析了各种业务场景下的OOM原因，并提供了优化方案，包括调整Executor内存和CPU资源、优化内存管理策略、数据切分及减少宽依赖等。通过综合运用这些方法，可有效解决Spark任务中的OOM问题。关注威哥爱编程，让编码更顺畅！

# 存储 # 缓存 # 分布式计算 # 大数据 # Spark

灵杰开发者

|

博文

|

来自：大数据与机器学习

云栖实录 | 开源大数据全面升级：Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展

在2024云栖大会开源大数据专场上，阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash，该引擎100%兼容Apache Flink标准，性能提升5-10倍，助力企业降本增效。此外，EMR Serverless Spark产品启动商业化，提供全托管Serverless服务，性能提升300%，并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行，欢迎报名参加。

# 云原生数据仓库AnalyticDB MySQL版 # 函数计算 # 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 分布式计算 # 大数据 # Serverless # 流计算 # Spark

小Lee

|

博文

大数据学习

【10月更文挑战第2天】大数据学习

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # Hadoop # Apache # Spark

刘大猫.

|

博文

Linux环境下 java程序提交spark任务到Yarn报错

# 云消息队列 Kafka 版 # 消息中间件 # 分布式计算 # Java # Kafka # Spark

数据知道

|

博文

28个大数据的高级工具汇总

文章汇总了28种大数据高级工具，并对Hadoop、Spark、Storm等关键技术进行了详细介绍，同时还提供了获取大数据集的多个资源链接。

# 云消息队列 Kafka 版 # 资源管理 # 云数据库 HBase 版 # 云原生大数据计算服务 MaxCompute # 日志服务 # 分布式计算 # Hadoop # 大数据 # Apache # Spark

1176112968452250

|

博文

死磕Flink(二)

# 容器服务Kubernetes版 # 资源管理 # 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 存储 # 分布式计算 # 大数据 # 流计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark