pandas - read_csv报错:‘utf-8‘/‘gbk‘ codec can‘t decode byte 0xb1 in position 0:invalid start byte

简介: pandas - read_csv报错:‘utf-8‘/‘gbk‘ codec can‘t decode byte 0xb1 in position 0:invalid start byte

问题描述


桌面上有个Excel文件,转换为csv文件后,导入jupyter notebook,read_csv报错

‘utf-8’/‘gbk’ codec can’t decode byte 0xb1 in position 0: invalid start byte


原因


Excel文件转换为csv文件后,编码格式为 ANSI ,jupyter notebook/python无法读取。


解决方法


将csv文件编码格式改为UTF-8格式。

首先,查看csv文件是什么编码格式,如果不是UTF-8,修改后重新上传读取。


1、如何查看csv文件是什么编码格式?

选中文件,右键——>打开方式——>记事本,右下角显示编码格式

0b8551bc96dc4a4d9e57d587f4747177.png

e7572b75466f40fea3d53310fbcd15e2.png

2、如果编码格式不是“UTF-8”,如何修改?

记事本——>文件——>另存为,选择UTF-8格式

d7cef2e1c16041c08f56f2186a982975.png

import pandas as pd
df = pd.read_csv("XXX.csv")
print(df)

最后,重新导入csv文件,就可以读取数据啦~

相关文章
|
3月前
|
编解码 IDE 开发工具
python ini文件包含中文时报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c 的解决办法
python ini文件包含中文时报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c 的解决办法
44 1
|
4月前
|
编解码 Python
pandas读取csv错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 0: invalid start byte
pandas读取csv错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 0: invalid start byte
148 0
|
5月前
|
Java
java 读取文件 获取byte[]字节 并执行Gzip的压缩和解压
java 读取文件 获取byte[]字节 并执行Gzip的压缩和解压
49 0
|
8月前
|
存储 Java 计算机视觉
java 之byte
当涉及到处理数据时,Java 提供了多种数据类型,其中包括 `byte` 类型。在本文中,我们将深入探讨 Java 中的 `byte` 数据类型,了解它的特点、用途以及在编程中的实际应用。
|
8月前
|
Java
Java中 String与基本数据类型,包装类,char[],byte[]之间的转换
Java中 String与基本数据类型,包装类,char[],byte[]之间的转换
56 0
|
10月前
|
存储 Java
[java 基础知识] byte int 互转
[java 基础知识] byte int 互转
99 0
|
11月前
|
存储 Java
java基础类型中的char和byte的辨析及Unicode编码和UTF-8的区别
java基础类型中的char和byte的辨析及Unicode编码和UTF-8的区别
150 0
|
Java 数据安全/隐私保护
JAVA RSA加密解密代码范例(byte[]版)
JAVA RSA加密解密代码范例(byte[]版)
114 0
java中整型数据(byte、short、int、long)溢出的现象及原理
java中整型数据(byte、short、int、long)溢出的现象及原理
Java中字节Byte和位Bit的关系
Java中字节Byte和位Bit的关系