备案控制台

开发者社区问答正文

如何防止kafka的spark sql在数据帧中向JSON字符串添加反斜杠

出于某种原因，我执行代码.wriestream.format（json）.option（Path）。我有json，由于某种原因，标签都有双“”。我想删除所有“”。

val selectData = kafkaDF.select(($"value" cast "string"))
val query = selectData
.writeStream
.format("json")
.option(path)

展开

收起

社区小助手 2018-12-12 14:24:29 3257 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

您正在将值转换为字符串，其中包含引号和斜杠，然后您将编写为JSON，因此它将对您的JSON进行双重编码。
试着写成文字
kafkaDF.select(($"value" cast "string")).writeStream.format("text")
或者根本不投
kafkaDF.select("value").writeStream.format("json")
如果你正在写一个文件系统，如HDFS或S3，那么我建议使用Kafka Connect，而不是编写和维护Spark代码。

2019-07-17 23:20:12

赞同展开评论

问答分类：

消息中间件 SQL JSON 分布式计算 Kafka 数据格式 Spark 云消息队列 Kafka 版

问答标签：

JSON字符串 apache spark SQL SQL字符串 SQL spark 云消息队列 Kafka 版json

问答地址：

开发者社区 > 大数据 > 问答

相关问答

flink sql输出到upsert kafka 下游再消费一般是upsert 还是 json呀？

145

0

0

flink kafka debezium-json读取更新的数据，没有op 怎么获取op为u的数据？

454

1

0

flinkcdcSQL处理Kafka数据，json数据是数组的，建表结构该怎么写？[{},{}]。？

174

0

0

flink cdc里 Oracle to kafka sql的提交方式咋还有序列化错误？

130

0

0

flink sql作业中，计算结果可以动态写入kafka不同主题吗？

77

1

0

kafka写入的数据如果是json数组，可以批量写入到tablestore吗？

95

0

0

为什么选择从Kafka + Spark Streaming转向Flink？

99

1

0

Flink CDC配置true以后下游kafka的canal-json内容里没有包怎么办？

145

0

0

Spark Structured Streaming 和 Kafka 在数据完整性推理上有何不足？

113

1

0

根据列中的值复制Spark数据帧中的行

3610

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

上传文件时提示“Illegal file path”，怎么解决的？

阿里云ESA是什么？边缘安全加速和CDN有什么区别？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

相关文章

混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

从“攒一锅再算”到“来一条就干一条”：大数据批处理到流处理的进化之路

Quick BI使用案例02：基于人员维度的指定时间段订单分组排序

Quick BI V6.0发布：让人人都能拥有的「超级数据分析师」到底强在哪？

《镜界构图师：Rokid AI眼镜赋能实时摄影构图AR指导系统》

还有其他疑问?