文档备案控制台

开发者社区问答正文

可以在飞行中构建spark代码并执行吗？

我正在尝试使用数据库CSV READER创建一个通用函数来读取csv文件。但是该选项不是强制性的，它可以根据我的输入json配置文件而有所不同。

例1：

"ReaderOption":{

                "delimiter":";",
                "header":"true",
                "inferSchema":"true",
                "schema":"""some custome schema.."""
        },

例2：

"ReaderOption":{

                    "delimiter":";",
                    "schema":"""some custome schema.."""
            },

是否可以在运行时构造选项或整个read语句并在spark中运行？

如下，

def readCsvWithOptions(): DataFrame=
{

val options:Map[String,String]= Map("inferSchema"->"true")
val readDF = jobContext.spark.read.format("com.databricks.spark.csv")
.option(options)
.load(inputPath)
readDF
}

展开

收起

社区小助手 2018-12-12 13:50:36 1724 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

def readCsvWithOptions（）：DataFrame = {

val选项：Map [String，String] = Map（“inferSchema” - >“true”）val readDF = jobContext.spark.read.format（“com.databricks.spark.csv”）。option（options）.load（ inputPath）readDF}

有一个选项，需要键，值对。

2019-07-17 23:20:08

赞同展开评论

问答分类：

JSON 分布式计算数据库 Spark 数据格式

问答标签：

apache spark构建 apache spark代码构建apache spark apache spark执行

问答地址：

开发者社区 > 大数据 > 问答

相关问答

dataworks中ODPS Spark 如何在代码中获取调度参数？

405

2

0

DataWorks中sql是写sql的代码节点 spark 是写sparksql的代码节点？

222

3

0

dataworks调用odps的spark中的pyspark代码报错找不到main函数什么情况啊？

223

1

0

DataWorks中spark sql 开发，是用官方给的代码分支直接开发打包吗？

178

1

0

spark.aliyun.odps.datasource 有没有基于scala 2.12构建的版本？

324

4

0

DataWorks中为什么同样的spark代码在不同的maxcompute项目中执行有的报错？

467

2

0

MaxCompute里如果我换成spark代码。昨天的功能可以实现吗？

208

1

0

想问一下idea编译spark代码，一定要在本地安装集群吗？

768

2

0

目前大数据行业除了做自有的产品外,hive,spark,flink等除了sql外,正常的业务会写代码

986

1

0

spark 执行RDD操作中的Lazy Calculate有什么好处吗？

2494

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

qoder work里面的deepseek太耗了。明显与AI模型的官网不符，阿里是否加价了？

期望出一个量大管饱的套餐，当前2000、3000 credits很快就用完了，根本不够用，谢谢

零基础如何用 ECS 搭建个人博客、独立网站？

QoderWork C：客户端频繁卡死、响应慢，Agent 回答到一半断掉

阿里云服务器官网入口链接？在哪进入查询精准报价？

相关文章

TokUI：向量空间JBoltAI引领的AI流式UI新范式

固信加密软件与阿里云结合：安全区域功能的实现与应用

执行计划进阶：读懂统计信息与基数估算，理解优化器的“思考方式”

阿里云服务器2核8G、4核16G、8核32G配置选购指南：热门实例性能与价格对比

支持私有部署的项目管理软件有哪些？2026年企业选型与测评

相关解决方案

更多

零代码微调，打造领域专属大模型

主动式智能导购 AI 助手构建

构建视频直播系统

高效构建全球网络服务性能观测体系

构建面向应用日志的实时监控

还有其他疑问?