创建完成
MaxCompute Java Module 后,即可开发 UDF。
操作步骤
注意:
- 如果指定项目下的表数据未被下载到 warehourse 中,需要先下载数据。默认下载100条,如需更多数据,请自行通过console的tunnel命令或studio的表下载功能。
- 如果采用 Mock 项目或已下载数据,则直接运行。
- UDF 的 local run 框架会将 warehouse 中指定列的数据作为 UDF 的输入,开始本地运行 UDF,您可以在控制台看到日志输出和结果打印。
注意:
- warehouse 目录下依次是项目名,tables,表名,表 schema 和 sample data。
- schema 文件依次配置项目名,表名,以及列名和类型(冒号分隔),分区表还需配置分区列(非分区表参考 wc_in1,分区表参考 wc_in2)。
- data 文件采用标准 csv 格式存储表的 sample 数据:特殊字符为逗号,双引号和换行(\n 或 \r\n)
- 列分隔符为逗号,行分隔符为 \n 或 \r\n
- 如果列内容里包含特殊字符,需要在该列内容前后加上双引号,例如:3,No -> “3, No”
- 如果列内容包含双引号,则每个双引号转义成两个双引号,例如:a”b”c -> “a””b””c”
- \N 表示该列为 null,如果该列内容(string 类型)就是 \N,需要转换为 “””\N”””
- 文件字符编码为UTF-8
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。