开发者社区> 问答> 正文

pyflink的where该如何使用?如何筛选?

我想要在输出表中进行条件筛选,使用了where语句,结果不行

我的代码如下:

处理流程

t_env.from_path('mySource') \

    .select("pickup_datetime, dropoff_datetime, pickup_longitude, pickup_latitude, dropoff_longitude, dropoff_latitude, distance_meters(pickup_longitude, pickup_latitude) as O, distance_meters(dropoff_longitude, dropoff_latitude) as D, compute_duration_time(pickup_datetime, dropoff_datetime) as duration") \

    .where("duration >= 120 && duration <= 3600") \

    .select("pickup_datetime, dropoff_datetime, pickup_longitude, pickup_latitude, dropoff_longitude, dropoff_latitude, O, D, is_same_od(O, D) as same_od, duration") \

    .where("same_od == 0") \

    .select("pickup_datetime, dropoff_datetime, pickup_longitude, pickup_latitude, dropoff_longitude, dropoff_latitude, O, D, duration") \

    .insert_into('mySink')

请问我这样使用where为什么不行呢?我应该如何去筛选出想要的结果呢?

(尝试了去掉where是可以正常运行的)*来自志愿者整理的flink邮件归档

展开
收起
说了是一只鲳鱼 2021-12-07 11:12:09 782 0
1 条回答
写回答
取消 提交回答
  • 你说的不行,指的是运行报错了 (如果报错了,可以贴下错误的日志), 还是出来的结果不符合预期(是不生效,还是啥的)。 *来自志愿者整理的flink邮件归档

    2021-12-07 11:27:41
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
大批量处理excel文件到ODPS中方案 立即下载
PyODPS架构以及DataFrame实现原理 立即下载
《Apache Flink-重新定义计算》PDF下载 立即下载