计算机的字符与编码集

简介: 计算机的字符与编码集

ASCII码

使用7个bits就可以完全表示ASCII码,包含

  • 95个可打印字符
  • 33个不可打印字符(包括控制字符)
    33 + 95 = 128 = 2^7

image.png

很多应用或国家中的符号都无法表示,比如数学符号 ÷≠≥≈π,第一次对ASCII码进行扩充,
7bits => 8bits

  • Extended ASCII码:常见数学运算符、带音标的欧洲字符、其他常用符、表格符等

image.png

字符编码集的国际化

欧洲、中亚、东亚、拉丁美洲国家的语言多样性,语言体系不一样,不以有限字符组合的语言,中国、韩国、日本等的语言最为复杂。

中文编码集

GB2312

《信息交换用汉字编码字符集-基本集》

共收录了7445个字符,,包括6763个汉字和682个其它符号

GB2312需要多少个比特位?

GBK

《汉字内码扩展规范》,向下兼容GB2312,向上支持国际ISO标准,收录了21003个汉字,支持全部中日韩汉字

Unicode

统一码、 万国码、单一码,Unicode定义了世界通用的符号集,UTF-*实现了编码,UTF-8以字节为单位对Unicode进行编码。

Windows系统默认使用GBK编码,编程推荐使用UTF-8编码

目录
相关文章
|
7月前
|
存储 编解码 算法
计算机编码
计算机编码
100 0
|
4月前
|
存储
字符编码问题之计算机需要编码转换过程如何解决
字符编码问题之计算机需要编码转换过程如何解决
35 0
【408计算机组成原理】—字符与字符串(四)
【408计算机组成原理】—字符与字符串(四)
|
存储 C语言
【实验向】问题:假设计算机A和计算机B通信,计算机A给计算机B发送一串16个字节的二进制字节串,以数组形式表示:
【实验向】问题:假设计算机A和计算机B通信,计算机A给计算机B发送一串16个字节的二进制字节串,以数组形式表示:
147 0
数制与编码
十进制整数转换为二进制数 可以将十进制数逐次用2除,取余数,一直到商为0.然后把全部余数按相反的次序排列起来。(除二取余)
322 0
数制与编码
|
存储
计算机组成原理——字符与字符串
计算机组成原理——字符与字符串
305 0
计算机组成原理——字符与字符串
|
存储 编解码 前端开发
【编码篇】看破字符 %20 之谜,百分号编码以及其背后
提到这个 %20,想必大家都见过,熟悉一点编码的人,还会知道这玩意就是空格转换而来! 那么我们一起破解, 如何编码而来? 我们今天继续学习前端编码知识
893 0
【编码篇】看破字符 %20 之谜,百分号编码以及其背后
|
存储 算法
计算机字符编码总结
ASCII,GB2312, GBK,GB18030,UNICODE,UTF8等计算机编码方式介绍。
243 0