python编码介绍

简介: python编码介绍

python编码介绍

常用字符编码

ASCII 编码

由于计算机是美国人发明的,因此,最早只有 127 个字母被编码到计算机中,也就是大小写英文字母、数字、标点符号和一些控制符号,这个编码表被称为 ASCII编码。

GBK2312

简体中文的字符编码,2B(字节)代表一个字符。要处理中文显然 1B 是不够的,至少需要 2B,而且还不能和 ASCII 编码冲突,所以,中国制定了 GBK2312 编码,用来把中文编进去。

GBK

GB2312 的扩展,除了兼容 GB2312 外,它还能显示繁体中文及日文的假名。

Unicode

国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,统一用 2B代表一个字符。UTF-8、UTF-16、UTF-32 都是将数字转换到程序数据的编码方案。

UTF-8

对 Unicode 编码的压缩和优化,它不再要求最少使用 2B,而是将所有的字符和符号进行分类。例如,ASCII 码中的内容用 1B 保存,欧洲的字符用 2B 保存,东亚地区的字符用 3B 保存。

内存中使用的编码是 Unicode(程序都需要加载到内存才能运行,所以内存要求尽可能地保证快);

硬盘中或者网络传输用 UTF-8(网络 I/O 延迟或磁盘 I/O 延迟要远大于 UTF-8 的转换延迟,而且 I/O 要求尽可能地节省带宽,以保证数据传输的稳定性)

Python 3数据默认编码Unicode代码默认使用 UTF-8。如果编辑器的编码设置和代码的实际编码不一致,有可能导致乱码。例如,Notepad++的默认编码是 UTF-8,而 Windows

的默认编码是 ANSI,ANSI 编码实际上是操作系统在不同语言版本下的编码,在简体中文版中,ANSI 是 GB2132,而在繁体中文版中是 BIG5 编码。所以,应确保编辑器和代码内容具有相同的编码设置。

外部数据编码

因为有默认编码,所以在源代码中创建的对象也具有相同的编码。但有时候我们会从外部获取数据,例如,从文件中读取文本,或者从网络上接收一个数据包,这就有可能获取具有不同编码的字符串。 为了正确地读出数据,必须将这些字符串解码为 Unicode,然后再将其编码为所用平台所支持的编码。

str = "我爱你祖国.mp3".encode('gbk')   # 创建用gbk编码的字符串
str_unicode= str.decode('gbk')       # 对gbk编码进行解码后为 Unicode
print(str_gbk)

执行结果如下

我爱你祖国.mp3

网上的数据大多数的编码为UTF-8,GBK这两种.

感谢大家的支持,关注,评论,点赞!

目录
相关文章
|
6月前
|
存储 Python
Python文件编码概念详解
Python文件编码概念详解
54 1
|
2月前
|
Python
python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)
这篇文章介绍了如何使用Python的第三方库chardet来检测字符串的编码类型,包括ASCII、GBK、UTF-8和日文编码的检测示例。
99 6
|
2月前
|
Python
Python 中如何指定 open 编码为ANSI
Python 中如何指定 open 编码为ANSI
|
3月前
|
数据采集 开发工具 Python
海康威视工业相机SDK+Python+PyQt开发数据采集系统(支持软件触发、编码器触发)
该系统基于海康威视工业相机SDK,使用Python与PyQt开发,支持Gige与USB相机设备的搜索及双相机同时显示。系统提供软件触发与编码器触发模式,并可在数据采集过程中实时保存图像。此外,用户可以调节曝光时间和增益,并进行信息输入,这些信息将被保存至配置文件以便下次自动加载。参数调节与实时预览等功能进一步增强了系统的实用性。
175 1
|
3月前
|
开发者 Python
Python编码风格
Python编码风格
22 1
|
3月前
|
JSON 数据库 开发者
FastAPI入门指南:Python开发者必看——从零基础到精通,掌握FastAPI的全栈式Web开发流程,解锁高效编码的秘密!
【8月更文挑战第31天】在当今的Web开发领域,FastAPI迅速成为开发者的热门选择。本指南带领Python开发者快速入门FastAPI,涵盖环境搭建、基础代码、路径参数、请求体处理、数据库操作及异常处理等内容,帮助你轻松掌握这一高效Web框架。通过实践操作,你将学会构建高性能的Web应用,并为后续复杂项目打下坚实基础。
92 0
|
4月前
|
Python
11个提升Python列表编码效率的高级技巧
Python中关于列表的一些很酷的技巧
51 1
|
4月前
|
存储 缓存 Python
python中小数据池和编码
python中小数据池和编码
53 3
|
4月前
|
缓存 Java Unix
python中内存管理等10个编码习惯
【7月更文挑战第3天】本文涵盖了Python编程中的变量管理、模块导入、命令行参数、内存管理和面向对象设计的10个关键概念。
45 0
python中内存管理等10个编码习惯
|
5月前
|
自然语言处理 Python
Python编码问题
Python编码问题是指在处理文本时,由于编码不一致导致程序不能正确处理文本的问题。在Python中,编码问题主要有两种情况:文件编码问题和字符串编码问题。
60 7