[oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB

简介: [oeasy]python0088_字节_Byte_存储单位_KB_MB_GB_TB

编码进化

回忆上次内容

  • 上次 回顾了 字符大战的结果
  • ibm 曾经的 EBCDIC 由于字符不连续的隐患
  • 导致后续 出现 无数问题
  • 无法补救
  • 7-bit 的 ASA X3.4-1963
  • 字母序号连续
  • 比较字符时 效率高
  • 判断字符 是否是字母 也很容易
  • 获得了 IBM以外公司的 支持

  • 为什么 ASA X3.4-1963 是 7-bit 编码?
  • 8-bit 不是才 正好一个字节 吗?🤔

ASA X3.4-1963 文档

  • 注意这篇文档
  • 通篇提到6-bit、7-bit
  • 但是
  • 没有提到Byte

  • 那时候
  • 还有没有 Byte这个词

bite

  • 1956年
  • ibm工程师 Werner Buchholz
  • 第一次 使用了bite 来描述8-bit
  • 开音节读作[bait]

  • bite 在1956年 太过超前

时代

  • 毕竟 当时的计算机
  • 还处于 从模拟 到数字 的过程中
  • 计算机的 输出设备是
  • 指示灯
  • 电压表
  • 示波器

  • bite这个词
  • 流传于Rand、 MIT、IBM
  • 为了 和bit 区分
  • bite 的拼写
  • 演化成 Byte

ASA X3.4-1963 发布

  • IBM 编码演化
  • BCD码 4-bit
  • 发展到BCDIC 6-bit
  • 包含了字符
  • 网络通信 让 计算机 不再是 孤岛
  • IBM之外的其他公司 想要统一通信标准
  • 到 7-bit的 ASA X3.4-1963

  • IBM 之外的公司 从产品层面跟进
  • IBM 想要 主导标准

词汇出现

  • 1964年
  • ibm 发布 System/360
  • 存储容量单位 为 Byte (8-bit)
  • 首款机型 4096 Byte

  • Byte 这个单词
  • 作为 营销话语中的 概念
  • 开始传播

孤注一掷

  • 为了配合 8-bit 的 System/360
  • 编码规则 从6-bit的 BCDIC
  • 直接跳到 8-bit的 EBCDIC

  • 这是 IBM最后的倔强

终局

  • 两年之后 1965年
  • ibm最新机器
  • 也开始 使用 ASA X3.4-1963
  • 编码统一到了 7-bit的 ASA X3.4-1963
  • 也就是 后来的ASCII
  • 字符编码大战尘埃落定

  • 可是为什么 ASCII编码 用 7-bit
  • 1个字节 却要 8-bit 呢?
  • 7-bit 不是 刚好放下 吗?

1个字节8位

  • 我们 来看看 Bemer的个人网站
  • 介绍 字符编码 进化过程
  • 5-bit的博多码
  • 6-bit的BCDIC
  • 7-bit的ASCII
  • 8-bit的EBCDIC

  • 为什么 字节是 8-bit
  • 而不是 7-bit 呢?
  • Bemer 的说法是
  • 2次幂的 魔法
  • 8 = 23

2次幂的魔法

  • 计算机 只有 两根手指
  • 每根 手指
  • 可以代表 (10)2进制种状态

  • 就像 电路 只有

  • 电灯 只有

手指 增多

  • (10)2进制根手指
  • 2根手指
  • 可以 代表(100)2进制种状态
  • 4种状态

  • 这就是 2-4 译码器(decoder)
  • 如果 有更多手指 呢?

3-8 译码器

  • (11)2进制根手指
  • 3根手指
  • 可以代表 (1000)2进制种状态
  • 8种状态
  • 这就是 3-8译码器(decoder)
  • 或者说是 3-8解码器

  • 再往后呢?

4-bit 寻址空间

  • (100)2进制根手指
  • 4根手指
  • 可以代表(10000)2进制种状态
  • 16种状态

  • 再往上呢?😁

8-bit 寻址空间

  • 从4-bit 直接跳到 8-bit

  • (1000)2进制根手指
  • 8根手指
  • 可以代表(100000000)2进制种状态
  • 256种状态
  • 8-bit的cpu
  • 直接寻址空间 可达256个Byte
  • 16-bit的寄存器
  • 直接寻址空间  64 x 1024 Byte
  • 相当于 64KByte
  • 随着 计算机字长的增加
  • 存储单位 在指数级增长

更多存储单位

  • 1 KB = 1024 Byte
  • 1 GB = 1024 KB
  • 1 TB = 1024 GB

  • 这都是 基于Byte的单位
  • Byte 就是 8-bit
  • 但是7-bit的ASCII字符
  • 怎么放入 8-bit 的 Byte呢?

8-bit

  • ascii 的位置
  • ascii大小写字母之间只差 1 位(bit)
  • 最前面的 1-bit
  • 是 标志位
  • 后面的 7-bit
  • 是 ascii 字符数值

  • 如果 标志位 是0
  • 那么 这个字符 就是ascii字符
  • ascii的字符范围
  • 0 - 127
  • ASA X3.4-1963 就这样
  • 成了 ASA X3.4-1965

总结

  • 这次 回顾了 计算机存储单位的演变
  • 最小的读写单位 是 bit
  • 8-bit 固定下来 成为了字节(Byte)
位数 容量
8-bit 1Byte
1024Byte 1 KB
1024 KB 1 MB
1024 MB 1 GB
1024 GB 1 TB
  • 存储字符时
  • 第1位 是 标志位
  • 后7位 是 ascii具体的值
  • 可以用 1Byte 存储
  • 计算机之间 有了 更多的通信
  • 编码统一 为的是 更好地通信
  • 计算机之间
  • 怎么 开始通信的 呢??🤔
  • 我们下次再说!👋
  • 蓝桥->https://www.lanqiao.cn/courses/3584
  • github->https://github.com/overmind1980/oeasy-python-tutorial
  • gitee->https://gitee.com/overmind1980/oeasypython
  • 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy
目录
相关文章
|
26天前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
107 80
|
1月前
|
人工智能 C语言 Python
[oeasy]python051_什么样的变量名能用_标识符_identifier
本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
115 69
|
1月前
|
Python
[oeasy]python050_如何删除变量_del_delete_variable
本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
115 68
|
5天前
|
C语言 Python
[oeasy]python058_一句话让python崩了
本文介绍了如何通过重新赋值`__builtins__`使Python环境崩溃,并探讨了下划线的来历及其在编程中的作用。文章回顾了上次内容,展示了覆盖内建模块导致系统崩溃的过程,解释了恢复方法,以及PEP 8规范中关于空格使用的建议。最后,文章总结了下划线在变量定义和提高代码可读性方面的重要性,并简述了其从打字机时代到计算机时代的演变。
21 10
|
15天前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
34 14
|
7天前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
20 3
|
10天前
|
存储 Python
[oeasy]python056_python中下划线是什么意思_underscore_理解_声明与赋值_改名字
在Python中,下划线有多种用途。单下划线(_)常用于避免命名冲突,如将`max`改为`max_`以保留内置函数功能。双下划线(__var__)通常用于特殊方法和属性,如`__name__`、`__doc__`等。此外,单下划线(_)在交互式解释器中表示上一次表达式的值,但不建议作为普通变量名使用。总结:下划线用于避免命名冲突及特殊标识。
15 1
|
24天前
|
C语言 Python
[oeasy]python054_python有哪些关键字_keyword_list_列表_reserved_words
本文介绍了Python的关键字列表及其使用规则。通过回顾`hello world`示例,解释了Python中的标识符命名规则,并探讨了关键字如`if`、`for`、`in`等不能作为变量名的原因。最后,通过`import keyword`和`print(keyword.kwlist)`展示了Python的所有关键字,并总结了关键字不能用作标识符的规则。
31 9
|
1月前
|
Unix 编译器 C语言
[oeasy]python052_[系统开发语言为什么默认是c语言
本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
27 5
|
1月前
|
Shell Python
[oeasy]python049_[词根溯源]locals_现在都定义了哪些变量
本文介绍了Python中`locals()`函数的使用方法及其在调试中的作用。通过回顾变量赋值、连等赋值、解包赋值等内容,文章详细解释了如何利用`locals()`函数查看当前作用域内的本地变量,并探讨了变量声明前后以及导入模块对本地变量的影响。最后,文章还涉及了一些与“local”相关的英语词汇,如`locate`、`allocate`等,帮助读者更好地理解“本地”概念在编程及日常生活中的应用。
36 9