开发者社区 问答 正文

使用pyspark将csv文件转换为parquet文件:Py4JJavaError:调用o347.parquet时发生错误[duplicate]

使用pyspark将csv文件转换为parquet文件:Py4JJavaError:调用o347.parquet时发生错误[duplicate]

展开
收起
社区小助手 2019-05-16 14:11:37 1761 分享 版权
1 条回答
写回答
取消 提交回答
  • 根据spark 2.4.0文档,

    DataFrames can be saved as Parquet files, maintaining the schema information.

    df.write.parquet("new_data.parquet")

    2019-07-17 23:35:24
    赞同 展开评论
问答地址: