- 注意
seek()的长度是按字节算的,字符编码存每个字符所占用的字节长度是不一样的,所以区分好自己的编码格式。 - 比如:
中国dzm按utf-8编码格式一个汉字3个字节,使用seek(3)就会将光标移动到中|国dzm之间,seek(6)就会是中国|dzm,英文字符还是一个字节,seek(7)就会是中国d|zm,另外gbk是2个字节一个汉字。 - 比如:一个汉字
utf-8中占3个字节,你偏偏设置2,这样就会报错'utf-8' codec can't decode byte 0xad in position 0: invalid start byte - 案例
中国dzm xyq test
# 查看一个汉字占用几个字节 print('我'.encode()) # b'\xe6\x88\x91' 也就是 3 个字节 # 读取文件 f = open('test.txt') # 输出一行内容 print(f.readline()) # 中国dzm # 读取文件 f = open('test.txt') # 移动光标到指定位置(注意:不是按字符来指定数字,而是按当前文件的编码格式来算字节数位置,如果你输入的字节数字错误会报错) # 比如:一个汉字 3 个字节,你偏偏设置 2 ,这样就会报错 'utf-8' codec can't decode byte 0xad in position 0: invalid start byte f.seek(3) # 输出一行内容 print(f.readline()) # 国dzm