[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB

简介: [oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB

编码进化

回忆上次内容

  • 上次 回顾了 字符大战的结果
  • ibm 曾经的 EBCDIC 由于字符不连续的隐患
  • 导致后续 出现 无数问题
  • 无法补救
  • 7-bit 的 ASA X3.4-1963
  • 字母序号连续
  • 比较字符时 效率高
  • 判断字符 是否是字母 也很容易
  • 获得了 IBM以外公司的 支持

  • 为什么 ASA X3.4-1963 是 7-bit 编码?
  • 8-bit 不是才 正好一个字节 吗?🤔

ASA X3.4-1963 文档

  • 注意这篇文档
  • 通篇提到6-bit、7-bit
  • 但是
  • 没有提到Byte

  • 那时候
  • 还有没有 Byte这个词

bite

  • 1956年
  • ibm工程师 Werner Buchholz
  • 第一次 使用了bite 来描述8-bit
  • 开音节读作[bait]

  • bite 在1956年 太过超前

时代

  • 毕竟 当时的计算机
  • 还处于 从模拟 到数字 的过程中
  • 计算机的 输出设备是
  • 指示灯
  • 电压表
  • 示波器

  • bite这个词
  • 流传于Rand、 MIT、IBM
  • 为了 和bit 区分
  • bite 的拼写
  • 演化成 Byte

ASA X3.4-1963 发布

  • IBM 编码演化
  • BCD码 4-bit
  • 发展到BCDIC 6-bit
  • 包含了字符
  • 网络通信 让 计算机 不再是 孤岛
  • IBM之外的其他公司 想要统一通信标准
  • 到 7-bit的 ASA X3.4-1963

  • IBM 之外的公司 从产品层面跟进
  • IBM 想要 主导标准

词汇出现

  • 1964年
  • ibm 发布 System/360
  • 存储容量单位 为 Byte (8-bit)
  • 首款机型 4096 Byte

  • Byte 这个单词
  • 作为 营销话语中的 概念
  • 开始传播

孤注一掷

  • 为了配合 8-bit 的 System/360
  • 编码规则 从6-bit的 BCDIC
  • 直接跳到 8-bit的 EBCDIC

  • 这是 IBM最后的倔强

终局

  • 两年之后 1965年
  • ibm最新机器
  • 也开始 使用 ASA X3.4-1963
  • 编码统一到了 7-bit的 ASA X3.4-1963
  • 也就是 后来的ASCII
  • 字符编码大战尘埃落定

  • 可是为什么 ASCII编码 用 7-bit
  • 1个字节 却要 8-bit 呢?
  • 7-bit 不是 刚好放下 吗?

1个字节8位

  • 我们 来看看 Bemer的个人网站
  • 介绍 字符编码 进化过程
  • 5-bit的博多码
  • 6-bit的BCDIC
  • 7-bit的ASCII
  • 8-bit的EBCDIC

  • 为什么 字节是 8-bit
  • 而不是 7-bit 呢?
  • Bemer 的说法是
  • 2次幂的 魔法
  • 8 = 23

2次幂的魔法

  • 计算机 只有 两根手指
  • 每根 手指
  • 可以代表 (10)2进制种状态

  • 就像 电路 只有

  • 电灯 只有

手指 增多

  • (10)2进制根手指
  • 2根手指
  • 可以 代表(100)2进制种状态
  • 4种状态

  • 这就是 2-4 译码器(decoder)
  • 如果 有更多手指 呢?

3-8 译码器

  • (11)2进制根手指
  • 3根手指
  • 可以代表 (1000)2进制种状态
  • 8种状态
  • 这就是 3-8译码器(decoder)
  • 或者说是 3-8解码器

  • 再往后呢?

4-bit 寻址空间

  • (100)2进制根手指
  • 4根手指
  • 可以代表(10000)2进制种状态
  • 16种状态

  • 再往上呢?😁

8-bit 寻址空间

  • 从4-bit 直接跳到 8-bit

  • (1000)2进制根手指
  • 8根手指
  • 可以代表(100000000)2进制种状态
  • 256种状态
  • 8-bit的cpu
  • 直接寻址空间 可达256个Byte
  • 16-bit的寄存器
  • 直接寻址空间  64 x 1024 Byte
  • 相当于 64KByte
  • 随着 计算机字长的增加
  • 存储单位 在指数级增长

更多存储单位

  • 1 KB = 1024 Byte
  • 1 GB = 1024 KB
  • 1 TB = 1024 GB

  • 这都是 基于Byte的单位
  • Byte 就是 8-bit
  • 但是7-bit的ASCII字符
  • 怎么放入 8-bit 的 Byte呢?

8-bit

  • ascii 的位置
  • ascii大小写字母之间只差 1 位(bit)
  • 最前面的 1-bit
  • 是 标志位
  • 后面的 7-bit
  • 是 ascii 字符数值

  • 如果 标志位 是0
  • 那么 这个字符 就是ascii字符
  • ascii的字符范围
  • 0 - 127
  • ASA X3.4-1963 就这样
  • 成了 ASA X3.4-1965

总结

  • 这次 回顾了 计算机存储单位的演变
  • 最小的读写单位 是 bit
  • 8-bit 固定下来 成为了字节(Byte)
位数 容量
8-bit 1Byte
1024Byte 1 KB
1024 KB 1 MB
1024 MB 1 GB
1024 GB 1 TB
  • 存储字符时
  • 第1位 是 标志位
  • 后7位 是 ascii具体的值
  • 可以用 1Byte 存储
  • 计算机之间 有了 更多的通信
  • 编码统一 为的是 更好地通信
  • 计算机之间
  • 怎么 开始通信的 呢??🤔
  • 我们下次再说!👋
  • 蓝桥->https://www.lanqiao.cn/courses/3584
  • github->https://github.com/overmind1980/oeasy-python-tutorial
  • gitee->https://gitee.com/overmind1980/oeasypython
  • 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy
目录
相关文章
|
12天前
|
存储 算法 数据挖掘
【2023年中国高校大数据挑战赛 】赛题 B DNA 存储中的序列聚类与比对 Python实现
本文介绍了2023年中国高校大数据挑战赛赛题B的Python实现方法,该赛题涉及DNA存储技术中的序列聚类与比对问题,包括错误率分析、序列聚类、拷贝数分布图的绘制以及比对模型的开发。
26 1
【2023年中国高校大数据挑战赛 】赛题 B DNA 存储中的序列聚类与比对 Python实现
|
1天前
|
程序员 开发工具 Python
[oeasy]python0030_动态控制断点_breakpoints_debug_调试
[oeasy]python0030_动态控制断点_breakpoints_debug_调试
6 2
|
15天前
|
程序员 Python
[oeasy]python0028_女性程序员_Eniac_girls_bug_Grace
回顾上次内容,我们了解到 `.py` 文件中的代码是按顺序一行行被解释执行的,可以使用 `pdb3 hello.py` 来调试程序。此外,我们探讨了“bug”这一术语的由来,它最早是在 1947 年由 Grace Murray Hopper 发现的一只真正的飞蛾所引起的计算机故障,从此“debugging”成了查找并修复程序错误的过程。早期的程序员大多为女性,因为她们通常更加细心且有耐心,这些特质对于检查错综复杂的线路和编程工作至关重要。编程与编织有着相似之处,都需要细致和有条理的操作。最后,我们认识到 bug 的存在是程序员工作的基础,没有 bug 就不需要程序员去修正它们。
27 3
|
29天前
|
Shell 程序员 开发工具
[oeasy]python0026_调试程序_pdb3_帮助_help_求助_文档
调试程序_debug_next_下一步_list_pdb3 🥋
33 1
|
8天前
|
程序员 Shell 开发工具
[oeasy]python029_ until_直接跳转到_unt_breakpoint_断点函数
回顾早期计算机操作员多为女性,她们甚至发明了“bug”这个词。为了体验调试过程,我们故意在Python脚本中引入了一个拼写错误,并通过直接运行程序遇到了`NameError`。 通过`until`命令,我们可以快速跳转到指定行执行,这对于大型项目非常有用。此外,`continue`(或简写`c`)命令则会一直执行到下一个断点或程序结束。我们还可以在代码中使用`breakpoint()`设置断点,配合`continue`命令使用,实现快速跳转至特定位置进行调试。 这些技巧使调试过程变得高效且有趣,如同解开谜题一般。下次我们将探讨如何在调试过程中动态设置与取消断点。
18 0
|
14天前
|
存储 JSON 程序员
Python文件操作与数据持久化:强大功能简化存储管理,助力程序员高效实现业务逻辑
【8月更文挑战第6天】数据是现代计算机程序的核心,但其存储与管理常常构成开发挑战。Python凭借其强大的文件操作与数据持久化机制,显著提升了编程效率。Python的文件处理简单直观,通过内置`open`函数即可轻松实现文本或二进制文件的读写。例如,仅需几行代码就能完成文本写入。此外,Python支持多种数据持久化方案,如文本文件、CSV、JSON及数据库操作。利用内置`json`模块,可以便捷地进行JSON数据的序列化与反序列化,实现数据的有效存储与检索。这些特性使得Python成为数据管理和存储的理想选择,让开发者能够更加专注于业务逻辑的实现。
25 0
|
1月前
|
缓存 Shell 开发工具
[oeasy]python024_vim读取文件_从头复制到尾_撤销_重做_reg_寄存器
[oeasy]python024_vim读取文件_从头复制到尾_撤销_重做_reg_寄存器
24 5
|
2月前
|
存储 Python
Python中使用列表和字典来存储和处理复杂的数据结构
Python中使用列表和字典来存储和处理复杂的数据结构
|
1月前
|
存储 数据可视化 数据处理
`geopandas`是一个开源项目,它为Python提供了地理空间数据处理的能力。它基于`pandas`库,并扩展了其对地理空间数据(如点、线、多边形等)的支持。`GeoDataFrame`是`geopandas`中的核心数据结构,它类似于`pandas`的`DataFrame`,但包含了一个额外的地理列(通常是`geometry`列),用于存储地理空间数据。
`geopandas`是一个开源项目,它为Python提供了地理空间数据处理的能力。它基于`pandas`库,并扩展了其对地理空间数据(如点、线、多边形等)的支持。`GeoDataFrame`是`geopandas`中的核心数据结构,它类似于`pandas`的`DataFrame`,但包含了一个额外的地理列(通常是`geometry`列),用于存储地理空间数据。
|
1月前
|
编解码 程序员 开发者
【Python】已解决:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start by
【Python】已解决:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start by
113 0