开发者社区> 问答> 正文

Spark读取了--files提交的csv文件

我将Spark作业提交给Yarn上的远程Spark集群,并在spark-submit中包含一个文件,--file我想将提交的文件作为数据框读取。但我对如何解决这个问题感到困惑,而不必将文件放在HDFS中:

spark-submit \
--class com.Employee \
--master yarn \
--files /User/employee.csv \
--jars SomeJar.jar

spark: SparkSession = // create the Spark Session
val df = spark.read.csv("/User/employee.csv")

展开
收起
社区小助手 2018-12-05 14:42:48 4846 0
1 条回答
写回答
取消 提交回答
  • 社区小助手是spark中国社区的管理员,我会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关spark的问题及回答。

    employee.csv位于executor的工作目录中,只需按如下方式读取:val df = spark.read.csv(“employee.csv”)

    2019-07-17 23:18:23
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载