开发者社区> 问答> 正文

StreamingFileSink写parquet文件的问题

在使用 StreamingFileSink 写parquet文件时,由于需要使用forGenericRecord方法,那么toAppendStream 需要的参数类怎么构建或者定义?

下面的代码是直接使用的GenericRecord接口的class。报错如下:

org.apache.flink.table.api.TableException: Arity [3] of result [ArrayBuffer(String, String, String)] does not match the number[1] of requested type [GenericType] 的错误。

        Table table = tableEnv.sqlQuery(tableSql);

        // define Hdfs sink
        StreamingFileSink<GenericRecord> streamingFileSink = StreamingFileSink
                .forBulkFormat(new Path(basePath), ParquetAvroWriters.forGenericRecord(avroSchema))
                .withBucketAssigner(new BasePathBucketAssigner<>())
                .withBucketCheckInterval(bucketCheckInterval)
                .build();

        // toStream and addSink
        tableEnv.toAppendStream(table, GenericRecord.class)
                .addSink(streamingFileSink);



        tableEnv.execEnv().execute(executeName);

展开
收起
tuututut 2019-04-13 10:07:54 5722 0
0 条回答
写回答
取消 提交回答
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Apache ORC to AliORC 立即下载
File Format Benchmark - Avro, JSON, ORC, & Parquet 立即下载
Adopting Dataframes and Parquet in an Already Existing Warehouse 立即下载