文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks中使用python3写了一个数据脱敏的UDF函数，直接调用py脚本测试正常；发布？

DataWorks中使用python3写了一个数据脱敏的UDF函数，直接调用py脚本测试正常；发布成udf以后，对中文脱敏返回乱码。调试发现udf获取到的输入为Unicode的字符串；使用encode("raw_unicode_escape").decode()将字符串解码为原始字符串，报'ascii' code can't decode byte 0xe5 in position 0:？

展开

收起

真的很搞笑 2023-07-17 15:38:31 343 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

如果您在DataWorks中开发了一个使用Python 3编写的数据脱敏UDF函数，并且在调用Python脚本测试时是正常的，但是在发布成UDF后对中文脱敏返回乱码，那么可能是由于字符编码问题引起的。

在DataWorks中，UDF函数可以接受不同类型的输入参数，包括字符串、数字、日期、数组等等。当输入参数为字符串时，需要注意字符编码的问题，以免出现乱码或者字符集不兼容的情况。

对于中文字符编码问题，您可以尝试使用Python内置的字符编码转换函数，例如encode和decode函数，将输入字符串从Unicode编码转换为其他编码格式，例如UTF-8等。可以使用以下代码片段将输入字符串从Unicode编码转换为UTF-8编码：

Copy
input_str = input_str.encode("raw_unicode_escape").decode("utf-8")
这段代码将输入字符串先使用"raw_unicode_escape"编码格式进行编码，然后再将编码后的结果使用UTF-8编码格式进行解码，得到最终的字符串结果。

需要注意的是，字符编码转换可能会对字符串长度和内容产生影响，应该根据具体的业务需求和数据特点，选择合适的编码格式和转换方式。同时，也可以使用DataWorks提供的字符编码设置和转换函数，例如convert函数和charset函数，来处理字符编码问题。

2023-07-21 08:03:47

赞同展开评论
芯在这

maxcompute函数么联系mc同学帮忙看看呐在群公告可以找到，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-07-17 15:44:46

赞同展开评论

问答分类：

DataWorks Python 大数据开发治理平台 DataWorks

问答标签：

测试数据 Python函数 Python py Python测试大数据开发治理平台 DataWorks数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks比如上线前，测试人员会根据指标的计算口径算出一个金额值，是不是这个值？

230

1

0

DataWorks数据源连通性测试通过，数据集成也可以选择到ck里的表，但是datax执行时报错？

396

2

0

在dataworks中配置maxcompute数据源时，测试连通性时报这个错是什么原因？

321

1

0

阿里函数计算控制台测试函数输出如果多次失败，请检查您的 HTTP 函数是否禁止了跨域请求，如何处理？

290

2

0

Serverless 应用引擎阿里云函数部署一个计算器计算9.9和9.11如何写测试？

244

1

0

dataworks调用odps的spark中的pyspark代码报错找不到main函数什么情况啊？

250

1

0

DataWorks阿里云执行冒烟测试，出现了一下运行中，然后一直显示等待时间，是什么情况？

194

1

0

dataworks中mysql的支持的函数可以使用源mysql中自定义的函数吗？

166

1

0

DataWorks为啥冒烟测试一直在排队？

249

1

0

DataWorks odsp中有类似于 string_agg的函数嘛？

457

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

BFF层设计实践

GEOS-5 FP-IT 同化与 OMI/Aura UV-2 1 轨道 L2 支持 Swath 13x24km V3 (OMUFPITMET)

评价与销量分析：除了价格，API还能看什么？

adg t_img - 图片翻译接口系列，json 数据返回

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

热门讨论

热门文章

数据服务报429请求次数过多咋办呀

数据来源：com.alibaba.fastjson.JSONException: syntax er

DataWorks这里改不了授权对象是什么情况？

dataworks一个业务流程的看板上的节点怎么看有没有定时调度呀，在节点界面调度中有配置定时调度？

DataWorks中${bdp.system.bizdate}系统不执行，有没有啥替换办法？

在DataWorks上使用PyODPS使用限制是什么？

DataWorks数据地图中是可以查到数据的，但是在【表】中的stg_test01提示不存在？

DataWorks当前使用的ram账户能访问oss，点那个文件夹会报错？

DataWorks每个项目空间的空间根节点每天什么时候自动调度？

DataWorks中语义分析异常-无法解析怎么办？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks产品使用合集之如何在不使用用querySql时，指定上游分区

DataWorks售前咨询

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

DataWorks操作报错合集之在运行数据分析任务时，底层依赖服务alisa.olap.submitjob出现了异常，如何解决

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

DataWorks AI助理：一句话，帮你搞定研发周报！

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

DataWorks操作报错合集之在执行SQL查询时遇到报错，代码为[XX000]，该怎么解决

欢迎加入DataWorks产品钉钉交流群

展开全部

还有其他疑问?