开发者社区> 问答> 正文

使用pyspark将csv文件转换为parquet文件:Py4JJavaError:调用o347.parquet时发生错误[duplicate]

使用pyspark将csv文件转换为parquet文件:Py4JJavaError:调用o347.parquet时发生错误[duplicate]

展开
收起
社区小助手 2019-05-16 14:11:37 1681 0
1 条回答
写回答
取消 提交回答
  • 根据spark 2.4.0文档,

    DataFrames can be saved as Parquet files, maintaining the schema information.

    df.write.parquet("new_data.parquet")

    2019-07-17 23:35:24
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Data Wrangling with PySpark fo 立即下载
File Format Benchmark - Avro, JSON, ORC, & Parquet 立即下载
Data Wrangling with PySpark for Data Scientists Who Know Pandas 立即下载