文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks离线同步进行编码格式设置或处理乱码问题

已解决

DataWorks离线同步进行编码格式设置或处理乱码问题如果数据中包括表情符，在同步过程中可能会报错脏数据：[13350975-0-0-writer] ERROR StdoutPluginCollector - 脏数据 {"exception":"Incorrect string value: '\xF0\x9F\x98\x82\xE8\xA2...' for column 'introduction' at row 1","record":[{"byteSize":8,"index":0,"rawData":9642,"type":"LONG"},}],"type":"writer"} 。

展开

收起

阿里云服务支持 2022-12-09 10:29:32 453 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

阿里云服务支持

推荐回答

官方回答

针对产生乱码的不同原因，选择相应的解决方法：

● 如果原始数据乱码，需首先处理好原始数据，再进行同步任务。

● 数据库和客户端编码格式不一致，需先修改编码格式。

● 浏览器编码和数据库或客户端编码格式不一致，需先统一编码格式，然后进行数据预览。

可以尝试以下操作：

● JDBC格式添加的数据源修改utf8mb4：jdbc:mysql://xxx.x.x.x:3306/database?com.mysql.jdbc.faultInjection.serverCharsetIndex=45

● 实例ID形式添加数据源：在数据库名后拼接，格式为：database?com.mysql.jdbc.faultInjection.serverCharsetIndex=45

● 修改数据库相关的编码格式为utf8mb4。例如，在RDS控制台修改RDS的数据库编码格式。（设置RDS数据源编码格式命令：set names utf8mb4。查看RDS数据库编码格式命令：show variables like 'char%'。）

2022-12-09 10:32:12

赞同展开评论

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks设置大数据开发治理平台 DataWorks离线大数据开发治理平台 DataWorks格式大数据开发治理平台 DataWorks乱码大数据开发治理平台 DataWorks格式设置

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks分区表如果设置了主键，可以实现insert into自动更新主键数据的效果吗？

277

1

0

DataWorks只要在提交节点的时候设置实例生成方式是‘发布后几生成’就可以了吗？

154

1

0

DataWorks离线和实时任务是不能放在一个资源组里跑的吧？

177

1

0

dataworks接口应该返回什么样的数据给你， yyyy-MM-dd HH:mm:ss 格式？

214

2

0

DataWorks为什么api返回，怎么调整都是整数，格式都调整过了的？

200

1

0

DataWorks中mongodb是json格式的数据，如何导入到dataworks中？

194

1

0

DataWorks这个业务日期是怎么设置的，怎么老是昨天的时间？

219

1

0

DataWorks有没有办法设置成触发的？

160

1

0

DataWorks数据开发--脚本模式--怎么设置参数？

281

1

0

我用dataworks建大数据计算MaxCompute的表好像没有副本数和压缩格式设置，怎么设置？

153

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

阿里云支持与服务

2306

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

阿里云MaxCompute云原生大数据计算服务全方位对接使用指南

阿里云DataWorks数据集成（Data Integration）对接配置完全指南

阿里云DataWorks数据同步与ETL处理完全指南：从数据集成到数据治理

阿里云智能决策平台对接使用完全指南：从架构解析到API集成实战

品牌别名、场景标签和指标聚合：AI回答数据清洗实践

热门讨论

热门文章

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

在智能数据建模中涉及的FML是什么的缩写，什么意思？

数据来源：com.alibaba.fastjson.JSONException: syntax er

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

DataWorks概述API网关是什么？

DateWorks上运行的任务，被kill掉了，日志中能查出来，被谁杀掉了吗？

DataWorks任务执行中报错这是啥问题？

数据服务报429请求次数过多咋办呀

在DataWorks上使用PyODPS使用限制是什么？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

DataWorks产品使用合集之如何访问周期任务运维

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks售前咨询

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

数据分析经典案例重现：使用DataWorks Notebook 实现Kaggle竞赛之房价预测，成为数据分析大神！

展开全部

还有其他疑问?