pandas库中的read_csv函数读取数据时候的路径问题详解(ValueError: embedded null character)

2023-03-24 691

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： read_csv()函数不仅是R语言中的一个读取csv文件的函数，也是pandas库中的一个函数。pandas是一个用于数据分析和处理的python库。它的read_csv函数可以读取csv文件里的数据，并将其转化为pandas里面的DataFrame对象。它由很多参数可以设置，例如分隔符、编码、列名、索引等。

read_csv()函数不仅是R语言中的一个读取csv文件的函数，也是pandas库中的一个函数。pandas是一个用于数据分析和处理的python库。它的read_csv函数可以读取csv文件里的数据，并将其转化为pandas里面的DataFrame对象。它由很多参数可以设置，例如分隔符、编码、列名、索引等。

@[toc]

read_csv函数的相关参数

pd.read_csv(
    filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]],
    sep=',',
    delimiter=None,
    header='infer',
    names=None,
    index_col=None,
    usecols=None,
    squeeze=False,
    prefix=None,
    mangle_dupe_cols=True,
    dtype=None,
    engine=None,
    converters=None,
    true_values=None,
    false_values=None,
    skipinitialspace=False,
    skiprows=None,
    skipfooter=0,
    nrows=None,
    na_values=None,
    keep_default_na=True,
    na_filter=True,
    verbose=False,
    skip_blank_lines=True,
    parse_dates=False,
    infer_datetime_format=False,
    keep_date_col=False,
    date_parser=None,
    dayfirst=False,
    cache_dates=True,
    iterator=False,
    chunksize=None,
    compression='infer',
    thousands=None,
    decimal: str = '.',
    lineterminator=None,
    quotechar='"',
    quoting=0,
    doublequote=True,
    escapechar=None,
    comment=None,
    encoding=None,
    dialect=None,
    error_bad_lines=True,
    warn_bad_lines=True,
    delim_whitespace=False,
    low_memory=True,
    memory_map=False,
    float_precision=None,
)

虽然这个参数的数量着实让人头痛，不过我们实际需要用到的往往只有前几个，所以不需要全部记忆。

参考示例：

# 导入pandas库
import pandas as pd

# 读取CSV文件
df = pd.read_csv("data.csv")

# 打印DataFrame对象
print(df)

路径问题

我们有时候使用read_csv函数的时候，往往会遇到报错，报错位置直指路径，报错内容为ValueError: embedded null character。遇到这种情况往往是因为我们的路径使用了'\'而没有在前面加r。具体情形如下图所示。
在这里插入图片描述
往往遇到这种情况，我们可以使用两种方法解决该问题。

解决方案

第一种：

方法：在路径前面加r
原因：因为在python字符串中，'\'具有转义的含义，路径前面加r是为了保持路径在读取时不被漏读，错读。如'\t'可代表TAB，'\n'可代表换行。加r可以使得'\'不背解读为转义字符。

加了r以后我们可以发现read_csv函数可以找到数据集的位置被读取它。效果如下：
在这里插入图片描述

第二种：

方法：将路径中的'\'前面再加一个'\'，也就是双斜杠。
原因：这样就算在路径读取的时候，系统把'\'当做转义字符处理，我们也还有一个'\'可以用来是read_csv函数读取到数据集文件的位置。

操作结果如下：
在这里插入图片描述

pandas库中的read_csv函数读取数据时候的路径问题详解(ValueError: embedded null character)

read_csv函数的相关参数

路径问题

解决方案

第一种：

第二种：

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

pandas库中的read_csv函数读取数据时候的路径问题详解(ValueError: embedded null character)

read_csv函数的相关参数

路径问题

解决方案

第一种：

第二种：

热门文章

最新文章

相关课程

相关电子书