创建CSV源表
Blink可以将CSV格式文件作为源表读入,进行计算,CSV需要定义的DDL如下:
create table csv_source(
id varchar,
name varchar
) with (
type ='csv',
path = 'hdfs://hdfsroot/csvpath/test.csv',
...
);
WITH参数
通用配置:
参数 | 注释说明 | 备注 |
---|---|---|
path | 文件路径 | 文件路径可以是oss/hdfs |
fieldDelim | 列分隔符 | 默认为’,’,支持Java风格的字符串转义 |
lineDelim | 行分隔符 | 默认为’\n’,支持Java风格的字符串转义 |
charset | 字符集 | 默认为UTF-8 |
emptyColumnAsNull | 空列不全 | 是否将空列补为null |
timezone | 时区 | 默认时区UTC |
firstLineAsHeader | 是否将第一行作为列名 | 默认false |
quoteCharacter | csv里面如果string的field里包含列分隔符,可以用这个quote character包起来 | 例如:1,”1,2”,3,quotaCharacter为’”‘ |
本文转自实时计算——
创建CSV源表