python字符编码-阿里云开发者社区

开发者社区> 技术小胖子> 正文

python字符编码

简介:
+关注继续查看

python字符编码


最早的字符编码标准:ASCII

    127个字符,没有中文

    1个英文字母需要1个字节

        8个位=1字节

        1024字节=1kb

        1024kb=1MB

后来为了扩展中文支持,出现了GB2312、GBK后来出现Unicode

    把所有语言统一到一套编码里

    每个字符占用2个字节


最后出现UTF-8 (unicode的压缩和优化)

    1个英文 1个字节

    1个中文 3个字节


python3.X 默认unicode编码,默认支持中文

    python3.X 输入英文用的ASCII编码,占用1个字节。

    python3.X 输入中文用UTF-8编码,占用3个字节。


python2.X 默认ASCII编码,无法支持中文

    支持中文方式:

    #!/bin/bash/env python    #解释器

    #_*_ coding:utf-8 _*_     #支持中文,用utf-8格式编码中文。


encode 编码

decode 解码


python3.X socket传输数据必须是 二进制 才能传输。

b开头是 二进制bytes类型。


转换举例:

msg = "你好"

print(msg.encode(encoding="utf-8"))   括号里不指定编码,默认使用utf-8编码

print(msg.encode(encoding="utf-8").decode(encoding="utf-8"))


python2.X会以系统默认编码进行编码



     本文转自506554897 51CTO博客,原文链接:http://blog.51cto.com/506554897/1906358,如需转载请自行联系原作者





版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
字符编码的奥秘
文件的存储方式:     文件都有自己的存储格式,比如最常见的txt,cpp,h,c,xml ,png, rmvb各种格式,还有自定义格式。这些文件不论是什么格式,都是存储在计算机硬盘里的2进制格存储,对应不同文件格式,有不同的软件解析。
831 0
《逻辑与计算机设计基础(原书第5版)》——1.6 字符编码
本节书摘来自华章计算机《逻辑与计算机设计基础(原书第5版)》一书中的第1章,第1.6节,作者:(美)M.莫里斯·马诺(M. Morris Mano)著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1120 0
mysql之字符编码问题
问题描述:新建数据库并新建表插入数据,中文乱码问题,即便将字符集通过命令行或者mysql客户端改为utf-8还是乱码。 问题原因:此问题目前主要出现在Linux为centos7安装mysql上,主要是通过源码编译安装mysql。
801 0
计算机字符编码总结
ASCII,GB2312, GBK,GB18030,UNICODE,UTF8等计算机编码方式介绍。
54 0
Python编程:Python2.7的MD5编码问题
Python编程:Python2.7的MD5编码问题
18 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13892 0
Python编程:字符串编码问题
Python编程:字符串编码问题
18 0
21119
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载