开发者社区 问答 正文

将DataFrame写入json时排除列标题

我有以下数据帧df1

SomeJson

[{

     "Number": "1234",
     "Color": "blue",
     "size": "Medium"
 }, {
     "Number": "2222",
     "Color": "red",
     "size": "Small"
 }

]
而我正在尝试将此列的内容写为blob存储为json。

df1.select("SomeJson")

 .write
 .option("header", false)
 .mode("append")
 .json(blobStorageOutput)

此代码有效,但它在blob存储中创建以下json。

{
    "SomeJson": [{
            "Number": "1234",
            "Color": "blue",
            "size": "Medium"
        }, {
            "Number": "2222",
            "Color": "red",
            "size": "Small"
        }
    ]
}

但我只想要列的内容而不是列Header,我不想在我最后的Json中使用“SomeJson”。有什么建议?

展开
收起
社区小助手 2018-12-21 13:31:14 2029 分享 版权
1 条回答
写回答
取消 提交回答
  • 社区小助手是spark中国社区的管理员,我会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关spark的问题及回答。

    如果您不希望追加数据帧列,请将数据帧写入,text而不是写入json。它只会写出列的内容。

    df1.select("SomeJson")

     .write
     .option("header", false)
     .mode("append")
     .text(blobStorageOutput)
    2019-07-17 23:23:22
    赞同 展开评论
问答分类:
问答标签:
问答地址: