开发者社区> 问答> 正文

MaxCompute使用tunnel命令上传或下载数据的时候如何指定文件数据的列分隔符

已解决

MaxCompute使用tunnel命令上传或下载数据的时候如何指定文件数据的列分隔符

展开
收起
提个问题! 2024-06-12 13:03:40 33 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答

    1. tunnel命令的-fd参数可以设置本地文件的列分隔符,默认值为英文逗号(,)

    2. Tunnel命令不支持正则表达式,如果要对数据做正则表达式过滤处理,请在上传数据前做处理,或者在数据上传到odps后,利用odpsSql以及odps提供的内建函数做处理,如果现有的函数无法满足要求,可以自写udf;也可以在java/python代码中调用tunnel sdk进行上传/下载,在代码中添加过滤逻辑

    3. 如果需要使用空格作为行/列分隔符,可以指定-fd "\u0000"或-rd "\u0000"

    4. 如果命令指定的行/列分割符,在源数据中也有,则命令会报错并提示列数不匹配,需要将源数据中与列分隔符重复的字符过滤掉,或者更改源数据,选择一个较为特殊的,与源数据中的任意字符都不重复的字符作为分隔符

    2024-06-12 13:03:41
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载
大数据&AI实战派 第2期 立即下载