麻烦问下，用这个代码 odps.write_table(table, data.values.tol

麻烦问下，用这个代码 odps.write_table(table, data.values.tolist()) 向maxcompute表写入数据，Python的DataFrame缺失值是NaN，写入maxcompute中就成了nan，而不是NULL，怎样让写入的数据缺失值是NULL呢?

展开

收起

十一0204 2023-04-11 23:05:23 663 版权

3 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
在Python中，将NaN值写入MaxCompute会被转化为nan字符串，而不是NULL值。因此，我们需要在写入之前将DataFrame中的NaN值替换为None，然后再写入到MaxCompute中。

示例代码：
```
import numpy as np
import pandas as pd
from odps import ODPS

# 连接ODPS
odps = ODPS(access_id='your_access_id', secret_access_key='your_access_key', project='your_project', endpoint='your_endpoint')

# 要写入的MaxCompute表名和DataFrame对象
table_name = 'your_table_name'
df = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', None], 'col3': [np.nan, 4, 5]})

# 将DataFrame中的NaN值转为None
df = df.where(pd.notnull(df), None)

# 写入MaxCompute表
odps.write_table(table_name, df.values.tolist())
```
在上述代码中，将DataFrame中的NaN值替换为None的语句是df = df.where(pd.notnull(df), None)，然后再将处理过的DataFrame转化为列表写入到MaxCompute表中。这样写入后，MaxCompute表中缺失值就会是NULL了。
2023-04-29 23:47:53

赞同展开评论
ReaganYoung

值得去的地方都没有捷径

您可以尝试使用pandas库中的replace方法将NaN替换为None，然后再将DataFrame写入maxcompute表中。示例代码如下：

import pandas as pd from odps import ODPS

创建ODPS连接

odps = ODPS('access_id', 'access_key', 'project_name', 'end_point')

读取数据到DataFrame

data = pd.read_csv('data.csv')

将NaN替换为None

data.replace(to_replace=pd.np.nan, value=None, inplace=True)

将DataFrame写入maxcompute表中

odps.write_table(table, data.values.tolist())

请注意，上述代码中的pd.np.nan是pandas库中的NaN值，该值应被替换为None以在maxcompute中表示NULL。

2023-04-15 14:40:51

赞同展开评论
凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

你好，可以先将将 DataFrame 中的 NaN 值替换为 None。

2023-04-12 22:14:27

赞同展开评论

麻烦问下，用这个代码 odps.write_table(table, data.values.tol

创建ODPS连接

读取数据到DataFrame

将NaN替换为None

将DataFrame写入maxcompute表中

大数据开发治理DataWorks

相关文章

热门讨论

热门文章