背景
在工作中经常会碰到字节串(bytes)与字符串(string)之间转换的问题,做个记录。
bytes只负责用字节序列的形式(二进制形式)存储数据,不关心数据本身是图片、文字、视频等等。如果需要使用并且展示的话,按照对应的解析规则处理,就可以拿到对应类型的数据。如常见的字符串类型,只需要使用对应的字符编码格式,就可以拿到字符串的内容。
下面会用一些代码来表示bytes的构造,以及和字符串之间的转换。
代码
先看一下代码。
#!/user/bin/env python # coding=utf-8 """ @project : csdn @author : huyi @file : byte_to_string.py @ide : PyCharm @time : 2021-12-23 11:47:45 """ # 不指定字符集 b1 = b'I love u , baby' print('b1', b1) print(b1[:-3]) # 指定字符集 b2 = bytes('今天天气真好/哈哈', encoding='UTF-8') print('b2', b2) # 字符串转为bytes str1 = '元宇宙会导致人类文明的停滞吗?' b3 = str1.encode('UTF-8') print('b3', b3) # bytes转为字符串方法1 str2 = str(b3, 'UTF-8') print('str2', str2) # bytes转为字符串方法1 str3 = b3.decode('UTF-8') print('str3', str3)
代码说明:
1、可以使用字符串前面加小写字母b的方式定义bytes,但是不建议,建议使用b2的定义方式,可以调整字符编码。
2、字符串类型的数据可以通过encode方法,将字符串按照字符编码转为bytes。
3、bytes也可以通过str的构造指定字符编码或者decode方法,将bytes转为字符串。
验证一下
PyDev console: starting. Python 3.6.13 |Anaconda, Inc.| (default, Mar 16 2021, 11:37:27) [MSC v.1916 64 bit (AMD64)] on win32 runfile('D:/spyder/csdn/tool/byte_to_string.py', wdir='D:/spyder/csdn/tool') b1 b'I love u , baby' b'I love u , b' b2 b'\xe4\xbb\x8a\xe5\xa4\xa9\xe5\xa4\xa9\xe6\xb0\x94\xe7\x9c\x9f\xe5\xa5\xbd/\xe5\x93\x88\xe5\x93\x88' b3 b'\xe5\x85\x83\xe5\xae\x87\xe5\xae\x99\xe4\xbc\x9a\xe5\xaf\xbc\xe8\x87\xb4\xe4\xba\xba\xe7\xb1\xbb\xe6\x96\x87\xe6\x98\x8e\xe7\x9a\x84\xe5\x81\x9c\xe6\xbb\x9e\xe5\x90\x97\xef\xbc\x9f' str2 元宇宙会导致人类文明的停滞吗? str3 元宇宙会导致人类文明的停滞吗?
总结
没啥总结的,记录分享。如果对你有用的话,看心情给个赞吧。