- 注意
seek()
的长度是按字节算的,字符编码存每个字符所占用的字节长度是不一样的,所以区分好自己的编码格式。 - 比如:
中国dzm
按utf-8
编码格式一个汉字3
个字节,使用seek(3)
就会将光标移动到中|国dzm
之间,seek(6)
就会是中国|dzm
,英文字符还是一个字节,seek(7)
就会是中国d|zm
,另外gbk
是2
个字节一个汉字。 - 比如:一个汉字
utf-8
中占3
个字节,你偏偏设置2
,这样就会报错'utf-8' codec can't decode byte 0xad in position 0: invalid start byte
- 案例
中国dzm xyq test
# 查看一个汉字占用几个字节 print('我'.encode()) # b'\xe6\x88\x91' 也就是 3 个字节 # 读取文件 f = open('test.txt') # 输出一行内容 print(f.readline()) # 中国dzm # 读取文件 f = open('test.txt') # 移动光标到指定位置(注意:不是按字符来指定数字,而是按当前文件的编码格式来算字节数位置,如果你输入的字节数字错误会报错) # 比如:一个汉字 3 个字节,你偏偏设置 2 ,这样就会报错 'utf-8' codec can't decode byte 0xad in position 0: invalid start byte f.seek(3) # 输出一行内容 print(f.readline()) # 国dzm