DataWorks发现离线节点同步到OSS上的数据读取出来就是去掉了空格的？

展开

收起

真的很搞笑 2023-11-14 08:02:57 195 版权

3 条回答

写回答

取消提交回答

sunrr

在DataWorks中，如果离线节点同步到OSS上的数据读取出来就是去掉了空格的，这可能是因为在同步过程中，数据被进行了预处理，其中包括了去除空格的操作。

在DataWorks的数据同步过程中，源端和目标端的配置可以自定义，包括数据预处理和后处理的规则。如果你在同步配置中启用了数据预处理，并且预处理规则中包含了去除空格的操作，那么数据在同步到目标端之前就会被去除空格。

如果你不希望数据在同步过程中被去除空格，你可以检查一下你的同步配置，看看是否启用了数据预处理，以及预处理规则中是否有去除空格的操作。如果有，你可以关闭数据预处理，或者修改预处理规则，去掉去除空格的操作。

2023-11-30 14:15:57

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在 DataWorks 中，当您从 OSS 上读取数据时，读取后的数据可能没有包含空格。这是因为在 DataWorks 的离线节点中，默认情况下会将所有空白字符视为分隔符，以便将数据拆分成行和列。
如果您希望保留空格，请在离线节点中设置相应的选项。具体操作如下：
在 DataWorks 离线节点的配置界面中，选择“文本文件”选项卡，然后在“列分隔符”字段中输入一个或多个空格。然后，您可以尝试再次读取数据，确认是否保留了空格。
当然，您也可以使用更简单的方法，即在读取数据后立即检查文件内容，以便确定是否包含了空格。如果发现文件内容未包含空格，请尝试修改 DataWorks 节点配置，直到达到预期的效果为止。

2023-11-14 13:47:35

赞同展开评论
芯在这

这个是在writer端的默认逻辑会对字段，trim，oss writer端的逻辑，csv类型会执行trim text不会，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-11-14 11:35:02

赞同展开评论

DataWorks发现离线节点同步到OSS上的数据读取出来就是去掉了空格的？

大数据开发治理DataWorks

相关文章

热门讨论

热门文章