在编写SQL代码时,可能会遇到这种场景(假如有两个字段column1,column2,当字段1小于某个值时,字段2等于0).
1.sql语句可以使用CASE WHEN:
SELECT
column1,
(CASE WHEN column1<10 THEN 0 ELSE column2 END) AS column2
FROM tabelName;
2.使用IF语句
SELECT
column1,
IF(column1<10,0,column2) AS column2
FROM tabelName;
那这种情况在PyODPS的DataFrame对象怎么操作呢?
from odps.df import DataFrame
#运行时显示详细信息
from odps import options
options.verbose = True
OdpsTable=odps.get_table('**一个表**')
InitialData = DataFrame(OdpsTable)
InitialData[InitialData['column1']<10,'column2']=0
其实ODPS是执行了IF语句,并返回了一个新表重新赋值给了InitialData。可以将options.verbose = True,查看PyODPS与ODPS交互过程中运行的命令。
更多技巧参考文档:http://pyodps.readthedocs.io/zh_CN/latest/df-basic-zh.html