开发者社区> 问答> 正文

StreamingFileSink写parquet文件的问题

tuututut 2019-04-13 10:07:54 591

在使用 StreamingFileSink 写parquet文件时,由于需要使用forGenericRecord方法,那么toAppendStream 需要的参数类怎么构建或者定义?

下面的代码是直接使用的GenericRecord接口的class。报错如下:

org.apache.flink.table.api.TableException: Arity [3] of result [ArrayBuffer(String, String, String)] does not match the number[1] of requested type [GenericType] 的错误。

        Table table = tableEnv.sqlQuery(tableSql);

        // define Hdfs sink
        StreamingFileSink<GenericRecord> streamingFileSink = StreamingFileSink
                .forBulkFormat(new Path(basePath), ParquetAvroWriters.forGenericRecord(avroSchema))
                .withBucketAssigner(new BasePathBucketAssigner<>())
                .withBucketCheckInterval(bucketCheckInterval)
                .build();

        // toStream and addSink
        tableEnv.toAppendStream(table, GenericRecord.class)
                .addSink(streamingFileSink);



        tableEnv.execEnv().execute(executeName);
分享到
取消 提交回答
全部回答(0)
+ 订阅

时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。

推荐文章