本文介绍日志服务投递OSS使用CSV存储的相关细节,其它内容请参考 投递日志到 OSS。
配置项 | 取值 | 备注 |
分隔符 delimiter | 字符 | 长度为1的字符串,用于分割不同字段 |
转义符 quote | 字符 | 长度为1的字符串,字段内出现分隔符(delimiter)或换行符等情况时,需要用quote前后包裹这个字段,避免读数据时造成字段错误切分 |
跳出符 escape | 字符 | 长度为1的字符串,默认设置与quote相同,暂不支持修改。字段内部出现quote(当成正常字符而不是转义符)时需要在quote前面加上escape做转义 |
无效字段内容 null | 字符串 | 当指定Key值不存在时,字段填写该字符串表示该字段无值 |
投递字段名称 header | 布尔 | 是否在csv文件的首行加上字段名的描述 |
保留字段 | 语义 |
__time__ | 日志的 Unix 时间戳(是从 1970 年 1 月 1 日开始所经过的秒数),由用户日志字段的 time 计算得到。 |
__topic__ | 日志的 topic。 |
__source__ | 日志来源的客户端 IP。 |
压缩类型 | 文件后缀 | OSS文件地址举例 |
无压缩 | .csv | oss://oss-shipper-shenzhen/ecs_test/2016/01/26/20/54_1453812893059571256_937.csv |
snappy | .snappy.csv | oss://oss-shipper-shenzhen/ecs_test/2016/01/26/20/54_1453812893059571256_937.snappy.csv |
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在配置日志服务将数据投递到OSS并采用CSV存储格式时,您需要关注以下几个关键配置点和操作步骤:
分隔符 (delimiter): 选择一个单字符作为字段间的分隔符,默认为逗号(,)。确保所选分隔符不会在字段内容中出现,以避免解析错误。
转义符 (quote): 使用特定字符(默认为双引号("))包裹含有特殊字符(如分隔符或换行符)的字段值,保证数据的正确读取。
无效字段内容 (null): 当配置的Key在日志中未找到时,该字段将填充为此指定的字符串,默认为空值字符串(null)。
投递字段名称 (header): 可选择是否在CSV文件的第一行添加列名,以便于理解各列数据含义。
保留字段: 日志服务自动提供__time__, topic, 和 source 等字段,可根据需求选择性加入CSV输出中。
综上所述,配置日志服务至OSS的CSV存储时,应细致规划分隔符、转义规则及输出头部信息,同时考虑是否利用预设的保留字段以及数据压缩方式,以满足后续数据分析或处理的具体需求。