文档备案控制台

开发者社区大数据文章正文

Apache Doris Spark Load快速体验之Spark部署（1）2

2023-08-09 442

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Apache Doris Spark Load快速体验之Spark部署（1）2

配置初始化

#进入spark配置目录
cd /opt/spark3.3.2/conf
cp spark-env.sh.template spark-env.sh
#新增如下配置
vim spark-env.sh
export JAVA_HOME=/usr/local/java/jdk1.8.0_361
export SCALA_HOME=/usr/local/scala/scala-2.12.15
export SPARK_HOME=/opt/spark3.3.2
export HADOOP_INSTALL=/usr/hadoop
export HADOOP_CONF_DIR=$HADOOP_INSTALL/etc/hadoop
export SPARK_MASTER_IP=doris
export SPARK_DRIVER_MEMORY=1G
export SPARK_EXECUTOR_MEMORY=1G
export SPARK_LOCAL_DIRS=/home/spark3.3.2
#编辑后:wq退出

配置slaves

#进入spark配置目录
cd /opt/spark3.3.2/conf
cp workers.template workers
#新增如下配置，改为自己的主机名：cat /etc/hostname 
vim workers
doris
##编辑后:wq退出

启动测试

#启动master
./sbin/start-master.sh
#启动wokers
./sbin/workers.sh

结果查看

jps
web（8080）

常见问题

master启动失败

异常详情：failed to launch

解决：

#本地使用的是scala 2.13; 改为2.12 - 无效
#需要下载scala版本对应的spark-3.3.2-bin-hadoop3-scala2.13.tgz

spark安装部署至此结束，安装部署过程中若遇到问题欢迎留言交流

文章标签：

分布式计算

Spark

Apache

关键词：

Apache doris

apache apache spark

Apache spark

apache spark Apache

apache spark部署

一臻数据

目录

相关文章

SelectDB

|

11月前

|

消息中间件 OLAP Kafka

Apache Doris 实时更新技术揭秘：为何在 OLAP 领域表现卓越？

Apache Doris 为何在 OLAP 领域表现卓越？凭借其主键模型、数据延迟、查询性能、并发处理、易用性等多方面特性的表现，在分析领域展现了独特的实时更新能力。

SelectDB

895 9 9

SelectDB

|

10月前

|

存储自然语言处理分布式计算

Apache Doris 3.1 正式发布：半结构化分析全面升级，湖仓一体能力再跃新高

Apache Doris 3.1 正式发布！全面升级半结构化分析，支持 VARIANT 稀疏列与模板化 Schema，提升湖仓一体能力，增强 Iceberg/Paimon 集成，优化存储引擎与查询性能，助力高效数据分析。

SelectDB

1175 4 4

Apache Doris 3.1 正式发布：半结构化分析全面升级，湖仓一体能力再跃新高

SelectDB

|

11月前

|

存储分布式计算 Apache

湖仓一体：小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃

小米通过将 Apache Doris（数据库）与 Apache Paimon（数据湖）深度融合，不仅解决了数据湖分析的性能瓶颈，更实现了 “1+1>2” 的协同效应。在这些实践下，小米在湖仓数据分析场景下获得了可观的业务收益。

SelectDB

1643 9 9

湖仓一体：小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃

SelectDB

|

11月前

|

人工智能运维监控

智能运维与数据治理：基于 Apache Doris 的 Data Agent 解决方案

本文基于 Apache Doris 数据运维治理 Agent 展开讨论，如何让 AI 成为 Doris 数据运维工程师和数据治理专家的智能助手，并在某些场景下实现对人工操作的全面替代。这种变革不仅仅是技术层面的进步，更是数据运维治理思维方式的根本性转变：从“被动响应”到“主动预防”，从“人工判断”到“智能决策”，从“孤立处理”到“协同治理”。

SelectDB

1735 11 11

智能运维与数据治理：基于 Apache Doris 的 Data Agent 解决方案

SelectDB

|

11月前

|

SQL 存储运维

Apache Doris 在菜鸟的大规模湖仓业务场景落地实践

本文介绍了 Apache Doris 在菜鸟的大规模落地的实践经验，菜鸟为什么选择 Doris，以及 Doris 如何在菜鸟从 0 开始，一步步的验证、落地，到如今上万核的规模，服务于各个业务线，Doris 已然成为菜鸟 OLAP 数据分析的最优选型。

SelectDB

675 2 2

Apache Doris 在菜鸟的大规模湖仓业务场景落地实践

SelectDB

|

10月前

|

SQL 人工智能数据挖掘

Apache Doris 4.0 AI 能力揭秘（二）：为企业级应用而生的 AI 函数设计与实践

Apache Doris 4.0 原生集成 LLM 函数，将大语言模型能力深度融入 SQL 引擎，实现文本处理智能化与数据分析一体化。通过十大函数，支持智能客服、内容分析、金融风控等场景，提升实时决策效率。采用资源池化管理，保障数据一致性，降低传输开销，毫秒级完成 AI 分析。结合缓存复用、并行执行与权限控制，兼顾性能、成本与安全，推动数据库向 AI 原生演进。

SelectDB

1049 0 0

Apache Doris 4.0 AI 能力揭秘（二）：为企业级应用而生的 AI 函数设计与实践

SelectDB

|

11月前

|

SQL 存储 JSON

Apache Doris 2.1.10 版本正式发布

亲爱的社区小伙伴们，Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

SelectDB

499 5 5

SelectDB

|

SQL 人工智能数据挖掘

Apache Doris + MCP：Agent 时代的实时数据分析底座

数据不再是静态的存储对象，而是流动的智能资源；数据库不再是单纯的存储系统，而是智能化的服务平台。Apache Doris 以其在 AI 方向的深度布局和技术创新，正在成为连接数据与智能的重要桥梁。

SelectDB

2025 0 2

Apache Doris + MCP：Agent 时代的实时数据分析底座

SelectDB

|

11月前

|

人工智能自然语言处理数据挖掘

Apache Doris 4.0 AI 能力揭秘（一）：AI 函数之 LLM 函数介绍

在即将发布的 Apache Doris 4.0 版本中，我们正式引入了一系列 LLM 函数，将前沿的 AI 能力与日常的数据分析相结合，无论是精准提取文本信息，还是对评论进行情感分类，亦或生成精炼的文本摘要，皆可在数据库内部无缝完成。

SelectDB

709 0 0

Apache Doris 4.0 AI 能力揭秘（一）：AI 函数之 LLM 函数介绍

SelectDB

|

11月前

|

存储人工智能 Apache

ApacheCon 2025中国开源年度报告：Apache Doris 国内第一

在 Apache 基金会管理的近 300 个顶级项目中，Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。

SelectDB

615 0 0

热门文章

最新文章

Spark SQL玩起来

Spark SQL性能优化

阿里巴巴瑾谦/沐远：云HBaseSQL及分析——Phoenix&Spark

【译】使用Spark SQL 运行大规模基因组工作流

【2022持续更新】大数据最全知识点整理-Spark篇

使用IntelliJ Idea开发Spark应用程序

10月17日Spark社区直播【Tablestore Spark Streaming Connector -- 海量结构化数据的实时计算和处理】

spark中连接oracle报异常java.sql.SQLException: No suitable driver

Spark 【Spark SQL（一）DataFrame的创建、保存与基本操作】

基于Spark技术的银行客户数据分析

2025 OSCAR丨与创新者同频！Apache RocketMQ 邀您共赴开源之约

Confluent 首席架构师万字剖析 Apache Fluss（三）：湖流一体

Confluent 首席架构师万字剖析 Apache Fluss（二）：核心架构

Apache ShenYu 架构学习指南

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新，共筑基于 Apache Flink Agents 的智能体 AI 未来

Apache Doris 与 ClickHouse：运维与开源闭源对比

Confluent 首席架构师万字剖析 Apache Fluss（一）：核心概念

Apache Doris 4.0 AI 能力揭秘（二）：为企业级应用而生的 AI 函数设计与实践

Apache Doris 3.1 正式发布：半结构化分析全面升级，湖仓一体能力再跃新高

Apache Kafka 分布式流处理平台技术详解与实践指南

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

Apache Flink 入门到实战 - Flink开源社区出品

大数据实时计算框架Spark快速入门

Apache Flink 入门

相关电子书

更多

Apache Flink技术进阶

Apache Spark: Cloud and On-Prem

Hybrid Cloud and Apache Spark

推荐镜像

更多

apache

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！