MaxCompute使用tunnel命令上传或下载数据的时候如何指定文件数据的列分隔符
1. tunnel命令的-fd参数可以设置本地文件的列分隔符,默认值为英文逗号(,)
2. Tunnel命令不支持正则表达式,如果要对数据做正则表达式过滤处理,请在上传数据前做处理,或者在数据上传到odps后,利用odpsSql以及odps提供的内建函数做处理,如果现有的函数无法满足要求,可以自写udf;也可以在java/python代码中调用tunnel sdk进行上传/下载,在代码中添加过滤逻辑
3. 如果需要使用空格作为行/列分隔符,可以指定-fd "\u0000"或-rd "\u0000"
4. 如果命令指定的行/列分割符,在源数据中也有,则命令会报错并提示列数不匹配,需要将源数据中与列分隔符重复的字符过滤掉,或者更改源数据,选择一个较为特殊的,与源数据中的任意字符都不重复的字符作为分隔符
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。