位、字节、字符与字(字母跟汉字)的爱恨情仇

简介: 位、字节、字符与字(字母跟汉字)的爱恨情仇

在开发过程中,我们经常遇到位、字节、字符以及字之间的关系。比如说mysql中创建表的时候我们一般都会使用char(m),varcahr(n)等,那你真的知道他们代表什么意思吗?不妨一起来讨论一下:

ps: 先来放个大招吧

位(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。

字节(byte):是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)

字符:是指计算机中使用的字母、数字、字和符号

  • ASCII码:
  1. 1个英文字母(不分大小写)= 1个字节的空间
  2. 1个中文汉字 = 2个字节的空间
  3. 1个ASCII码 = 一个字节
  • UTF-8编码:
  1. 1个英文字符 = 1个字节
  2. 1个英文标点 = 1个字节
  3. 1个中文(含繁体) = 3个字节
  4. 1个中文标点 = 3个字节
  • Unicode编码:
  1. 1个英文字符 = 2个字节
  2. 1个英文标点 = 2个字节
  3. 1个中文(含繁体) = 2个字节
  4. 1个中文标点 = 2个字节
因为网上的优质文章比较多,只是比较难寻找,
为了节省大家时间,我找了几篇比较好的文章放在下面。
  • 精选相关文章
  1. 计算机中,为什么一个字节是8位?

依据ascill码表来分析,为什么一个字是8位

  1. ASCII、Unicode、UTF-8、UTF-16、GBK、GB2312、ANSI等编码方式简析

标准ASCII码占用一个字节,但是只用了后7位,第一位是0.一个字节本来可以表示256种不同情况,而由此ASCII码只有128种符号。这128种符号包括英文26字母的大小写、数字0-9、32个不可打印的控制字母、符号(就是我们在键盘上可以看到的符号)

  1. GBK,UTF-8,UTF-16之间的转换
  • 不同编码转换的理论基础
    1. UTF-16转UTF-8
    2. UTF-16转GBK
    3. UTF-16和UTF-8之间的转换

  1. UTF-8, a transformation format of ISO 10646

建议从1开始看,了解其所以然。

从小学数学的角度来看的话就是:字 ≥ 字符 ≥ 字节 > 位

相关文章
|
弹性计算 负载均衡 容灾
阿里云服务器地域和可用区之间是什么关系?地域和可用区的区别与选择参考
不管是选择阿里云的国内云服务器还是国外云服务器,都有多个地域及可用区选择,目前国内地域有北京、青岛、甚至等13个地域可选,国外地域有韩国、新加坡、悉尼等15个地域可选,每个地域又有多个可用区可选,那么阿里云服务器地域和可用区之间是什么关系?作为用户的我们又改如何选择呢?本文介绍阿里云地域和可用区的概念、选择指导、两者的关系以及阿里云支持的地域和可用区列表。
1180 0
阿里云服务器地域和可用区之间是什么关系?地域和可用区的区别与选择参考
|
算法 网络协议 Linux
【Cisco Packet Tracer】交换机的自学习算法
【Cisco Packet Tracer】交换机的自学习算法
680 0
|
弹性计算 安全 Linux
阿里云服务器购买图文教程参考,四种购买阿里云服务器的方式及适用场景分享
阿里云服务器如何购买?目前主要的购买方式有自定义购买、快速购买、通过活动购买、通过云市场镜像页面购买这四种购买方式,每种方式都有主要的适合对象,购买流程也不是完全一样的。例如想要快速购买的用户,一般选择快速购买、通过活动购买最好,如果是想购买的云服务器已经部署好一些自己项目运行所需的各种环境和软件,则选择通过云市场镜像页面购买这种方式更好。本文为以图文形式为大家展示四种购买阿里云服务器的方式及适用场景,以供参考。
阿里云服务器购买图文教程参考,四种购买阿里云服务器的方式及适用场景分享
|
Java Maven
maven报错:[ERROR] 不再支持源选项 7。请使用 8 或更高版本。
maven报错:[ERROR] 不再支持源选项 7。请使用 8 或更高版本。
996 0
|
9月前
|
存储 缓存 安全
系统显卡驱动程序卸载工具,DDU中文绿色版下载,免费显卡驱动彻底卸载工具
Display Driver Uninstaller(DDU)是一款专业显卡驱动卸载工具,支持彻底删除AMD/NVIDIA/Intel显卡驱动及相关残留文件,适用于驱动损坏、版本过旧或系统冲突等情况。绿色版无需安装,操作简单,可帮助用户实现干净的驱动环境。
3971 0
|
机器学习/深度学习 编解码 计算机视觉
RT-DETR改进策略【注意力机制篇】| CVPRW-2024 分层互补注意力混合层 H-RAMi 针对低质量图像的特征提取模块
RT-DETR改进策略【注意力机制篇】| CVPRW-2024 分层互补注意力混合层 H-RAMi 针对低质量图像的特征提取模块
207 0
|
Java Maven 开发者
"揭秘IDEA的神奇助手:Maven Helper插件,让你轻松驾驭复杂依赖,告别冲突噩梦!"
【8月更文挑战第20天】Maven Helper是一款提升Java开发者工作效率的IDEA插件,它能直观展示项目依赖关系并协助管理。主要功能包括依赖树视图、冲突检测与解决及依赖排除。安装简便,重启IDEA后即用。借助其“Dependencies”面板,开发者可以清晰了解依赖详情,快速定位并解决冲突问题,有效优化项目结构,提升开发效率。
1582 0
|
机器学习/深度学习 数据采集 人工智能
《解锁AI时代必备技能,抢占未来先机》
在科技飞速发展的今天,AI已融入生活的方方面面。掌握AI时代的必备技能尤为重要,包括编程与数据处理、机器学习与深度学习、创新与协作及批判性思维与持续学习。编程语言如Python是关键工具,数据处理能力不可或缺;深入理解机器学习和深度学习能助你成为AI高手;创新思维和团队协作精神助力突破;批判性思维和持续学习确保不被淘汰。掌握这些技能,抓住机遇,实现自我价值,在AI时代乘风破浪。
616 0
|
机器学习/深度学习 自然语言处理 算法
汉字的探索性分词方式:基于字图的部首分解与图神经网络的多因素表示
本文提出一种结合传统字符嵌入与部首结构的图表示法,用于捕捉汉字的语义和组成结构,提升大模型对汉字的理解能力。方法包括将字符分解为部首,构建部首图,并利用图卷积网络生成嵌入。此方法增强了模型的泛化能力和灵活性,并提供了代码实现。未来可优化的方向包括改进图构建算法、扩展部首系统、探索更先进的图神经网络架构及多模态融合。
544 2
|
测试技术 Android开发 Python