创建CSV源表
Blink可以将CSV格式文件作为源表读入,进行计算,CSV需要定义的DDL如下:
create table csv_source(id varchar,name varchar) with (type ='csv',path = 'hdfs://hdfsroot/csvpath/test.csv',...);
WITH参数
通用配置:
| 参数 | 注释说明 | 备注 |
|---|---|---|
| path | 文件路径 | 文件路径可以是oss/hdfs |
| fieldDelim | 列分隔符 | 默认为’,’,支持Java风格的字符串转义 |
| lineDelim | 行分隔符 | 默认为’\n’,支持Java风格的字符串转义 |
| charset | 字符集 | 默认为UTF-8 |
| emptyColumnAsNull | 空列不全 | 是否将空列补为null |
| timezone | 时区 | 默认时区UTC |
| firstLineAsHeader | 是否将第一行作为列名 | 默认false |
| quoteCharacter | csv里面如果string的field里包含列分隔符,可以用这个quote character包起来 | 例如:1,”1,2”,3,quotaCharacter为’”‘ |
本文转自实时计算——
创建CSV源表