字符编码小结

简介:
ANSI      -> Ascii :    American Standard Code for information interchange;一个字节/字符;0~0x32 为控制码;33~255 为 字符;
http://www.cs.utk.edu/~pham/ascii.html

中 国人民  ->GB2312:  去掉Ascii表127之后的定义. 规定:一个小于127的字符意义与原来相同, 两个大于127的字符组合在一起就表示一个汉字,这些由两个字符组成的汉字叫全角字符,1~127的叫半角字符 [0xA1,0xF7][0xA1,0xFE]。

中国人民  ->GBK:      只要第一个字节大于127 ,这个字节和随后的字节表示一个汉字 [0xA1,0xF7][0x00,0xFE],GBK包含了gb2312的全部字符。

ISO      ->UNICODE: 所有字符都用2字节编码, Windows 的核心使用的就是UNICODE
             ->UTF-8:动态编码,字母和数字一般用1个字节表示,汉字和其他字符用2~3个字节表示规则如下表。
ISO 和UTF-8的转换规则: 
Unicode
UTF-8 
0000 - 007F
0xxxxxxx
0080 - 07FF
110xxxxx 10xxxxxx
0800 - FFFF
1110xxxx 10xxxxxx 10xxxxxx
 
查看字符的2进制代码: 
把文件后缀改为bin 然后用VS 打开 



本文转自 xhinkerx 51CTO博客,原文链接:http://blog.51cto.com/xhinker/214502,如需转载请自行联系原作者
目录
相关文章
|
C++
C/C++给文件加crc校验
C/C++给文件加crc校验
247 1
|
10月前
|
UED 开发者
鸿蒙next版开发:ArkTS组件通用属性(图片边框设置)
在HarmonyOS 5.0中,ArkTS提供了灵活的图片边框设置属性,使开发者可以为应用中的图片组件添加各种边框效果,提升视觉效果和用户体验。本文详细解读了ArkTS中图片边框设置的通用属性,并提供了示例代码。通过设置`borderImage`属性,可以控制边框的图源、切割宽度、边框宽度、延伸距离、平铺模式和是否填充。示例代码展示了如何使用这些属性来创建具有不同边框效果的图片组件。图片边框设置在美化界面、区分内容和增强交互方面有重要作用。
416 5
|
10月前
|
算法 Java API
Sentinel学习圣经:从入门到精通 Sentinel,最全详解 (40+图文全面总结)
尼恩给大家做一下系统化、体系化的梳理,联合社群小伙伴,来一个Sentinel学习圣经:从入门到精通Sentinel。
|
XML 机器学习/深度学习 数据格式
YOLOv8训练自己的数据集+常用传参说明
YOLOv8训练自己的数据集+常用传参说明
18996 1
|
存储 缓存 Unix
QEMU-img工具
QEMU-img工具
1895 1
|
存储 缓存 负载均衡
高可用分布式缓存:深入了解 Redis Cluster
在现代的分布式系统中,高效的缓存方案对于提高性能和可扩展性至关重要。Redis Cluster,作为一种分布式的高可用缓存解决方案,能够满足大规模应用的缓存需求。本文将为您详细介绍 Redis Cluster 的核心概念、特性以及在分布式架构中的应用。
530 0
|
监控 算法 测试技术
【Go语言专栏】Go语言的性能优化与内存分析
【4月更文挑战第30天】本文探讨了Go语言的性能优化策略和内存分析方法。性能优化原则包括基准测试、分析瓶颈、避免过早优化和持续监控。优化策略涉及减少内存分配、避免内存逃逸、利用并发、优化算法和数据结构以及减少系统调用。内存分析借助于Go的`pprof`工具、内存分配跟踪和第三方工具,以发现内存泄漏和管理问题。通过这些方法,开发者能提升Go程序效率和资源利用率。
194 0
|
SQL 存储 人工智能
|
Shell
Shell 输入/输出的重定向含义(>、>>、2>、2>>、&>、&>>、1>&2、2>&1)
Shell 输入/输出的重定向含义(>、>>、2>、2>>、&>、&>>、1>&2、2>&1)
238 0
|
容灾
《云上容灾交付服务白皮书》电子版地址
《云上容灾交付服务白皮书》站在业务全局视角,从需求分析到方案设计、项目实施,最后到容灾切换演练,定义了一条较清晰的云上容灾最佳实践路线,总结为“五阶十三步”。
159 0
《云上容灾交付服务白皮书》电子版地址