[oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

简介: [oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

 

打包和解包

回忆上次内容

    • decode

     

      • 就是解码
        • 解码和编码可以转化
          • encode 编码
          • decode 解码
          • 互为逆过程
            • 大小写字母之间序号全都相差(32)10进制

            image.gif编辑

              • 这是为什么呢?🤔

              差距

                • 大写字母和小写字母
                  • 总是相差(32)10进制

                  image.gif编辑

                    • 从10进制角度看不清楚
                    • 我们从16进制的角度看看

                    16进制

                      • 正好是(0x20)16进制

                      image.gif编辑

                        • 为什么不多不少
                          • 就差 0x20 呢?
                          • 怎么那么寸呢?🤔
                            • 转化为2进制之后
                              • 恰好是1位(bit)
                                • 这是偶然的吗?

                                ASCII 码表趣事

                                  • 其实最初相差的并不是 0x20
                                    • 之前 ibm 的 EBCDIC 编码也是这样的

                                    正在上传…重新上传取消

                                      • 也相差一个2进制位

                                      image.gif编辑

                                        • EBCDIC问题是字母不连续
                                          • i、j之间不直接相连
                                            • EBCDIC最终被ascii所淘汰

                                            ASCII

                                              • ASCII字母是连续的
                                                • 而且大小写字母间
                                                • 相差正好是 1个 二进制位
                                                • 对应 b6 这个位
                                                  • 那为什么要差 1个 二进制位 呢?

                                                  image.gif编辑

                                                    • 有了这种对应关系之后
                                                      • 做大小写不敏感的字符串查找就快多了
                                                      • 这个 0x20 发生在 1963 年 5 月
                                                        • The X3.2.4 task group voted its approval for the change to ASCII at its May 1963 meeting.
                                                        • Locating the lowercase letters in columns 6 and 7 caused the characters to differ in bit pattern from the upper case by a single bit, which simplified case-insensitive character matching and the construction of keyboards and printers.
                                                          • 当时的目的是
                                                            • 降低大小写不敏感字符串匹配的难度
                                                            • 降低打字机键盘的构造成本
                                                              • 如果搜索中遇到的是小写字母
                                                                • 修改1位之后
                                                                  • 小写就都变成大写
                                                                  • 不用查找对应关系表匹配
                                                                    • 然后再观察全大写的情况下是否匹配
                                                                      • 这就是大小写字母的情况
                                                                        • 0x41-0x5A这个范围是大写字母
                                                                        • 0x61-0x7A这个范围是小写字母
                                                                          • 除了大小写字母之外
                                                                            • 数字字符又是如何表示的呢?

                                                                            ASCII 码表范围

                                                                            image.gif编辑

                                                                              • 0x30-0x39这个范围是数字
                                                                                • 数字的编码减去0x30正好得到数字本身
                                                                                • 后四位刚好是BCD编码模式
                                                                                  • Binary-Coded Decimal

                                                                                  image.gif编辑

                                                                                    • 我们再来看看 ASCII 除了字母和数字还有什么?

                                                                                    各种符号

                                                                                      • 各种符号是不连续的

                                                                                      image.gif编辑

                                                                                        • 穿插在数字、字母周围
                                                                                          • sp 其实就是space(空格)
                                                                                            • 表格最左边是什么呢?

                                                                                            ASCII

                                                                                              • 0x20-0x7F 之间有各种真实字符

                                                                                              image.gif编辑

                                                                                                • 0x00-0x1F 之间的东西是什么?
                                                                                                  • 前两列都是对应多个字符的
                                                                                                    • 具体含义目前还不知道
                                                                                                      • ASCII中的字符本来英语里就有
                                                                                                        • 但是字符是英文字符、数字和标点
                                                                                                          • 怎么编码的呢?

                                                                                                          ASCII由来

                                                                                                            • ASCII码是由电报代码发展而来的

                                                                                                            正在上传…重新上传取消

                                                                                                              • 由贝尔数据服务公司推广

                                                                                                              image.gif编辑

                                                                                                                • 电报码不是摩斯电码吗?

                                                                                                                摩斯电码

                                                                                                                  • 更早之前确实是摩斯电码
                                                                                                                  • 下图是他的编码表
                                                                                                                    • 分成长和短两种信号,就是嘀和嗒

                                                                                                                    image.gif编辑

                                                                                                                        • 欢迎您有机会来看看oeasy电学、科学史那几个系列
                                                                                                                          • 还记得encode/decode中的code么?
                                                                                                                            • 曾经一度指的就是各种电报编码汇编
                                                                                                                            • 后来统一到摩斯电码

                                                                                                                            摩斯电码通信规则

                                                                                                                              • 下图是他的通信规则
                                                                                                                                • 三个断确认本字符结束了
                                                                                                                                • 三个断就是字符之间的分隔符
                                                                                                                                • 录入状态并不是 0、1 两种状态
                                                                                                                                • 而是长、短、暂停三种状态

                                                                                                                                image.gif编辑

                                                                                                                                  • 编码的原则是什么呢?

                                                                                                                                  效率问题

                                                                                                                                    • 编码的规则是常用的字符点击次数少
                                                                                                                                      • 按照字符出现概率分配对应点击数量
                                                                                                                                        • TE 出现频率最高
                                                                                                                                        • 所以用一次点击电键的数量
                                                                                                                                          • 本质上是一棵霍夫曼树

                                                                                                                                          image.gif编辑

                                                                                                                                            • 当时发射和接收全靠人
                                                                                                                                              • 什么叫长、什么叫短、什么叫断
                                                                                                                                                • 发送者控制发报速度
                                                                                                                                                  • 接收者跟着这个发报速度
                                                                                                                                                  • 现查表是来不及的
                                                                                                                                                  • 需要熟悉
                                                                                                                                                    • 摩斯电码码表
                                                                                                                                                    • 常用缩写
                                                                                                                                                      • 这摩斯电码是3进制的编码方式
                                                                                                                                                      • 怎么变成ascii这种0101的二进制编码的呢?

                                                                                                                                                      总结

                                                                                                                                                        • ASCII 由这样几类字符构成
                                                                                                                                                          • 英文大写字符
                                                                                                                                                          • 英文小写字符
                                                                                                                                                          • 数字
                                                                                                                                                          • 符号
                                                                                                                                                            • 电报时代对于英文、数字的编码
                                                                                                                                                              • 使用的是摩斯电码

                                                                                                                                                              image.gif编辑

                                                                                                                                                                • 这摩斯电码是3进制的编码方式
                                                                                                                                                                  • 长短空
                                                                                                                                                                    相关文章
                                                                                                                                                                    |
                                                                                                                                                                    18天前
                                                                                                                                                                    |
                                                                                                                                                                    Unix Linux 程序员
                                                                                                                                                                    [oeasy]python053_学编程为什么从hello_world_开始
                                                                                                                                                                    视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
                                                                                                                                                                    102 80
                                                                                                                                                                    |
                                                                                                                                                                    25天前
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 C语言 Python
                                                                                                                                                                    [oeasy]python051_什么样的变量名能用_标识符_identifier
                                                                                                                                                                    本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
                                                                                                                                                                    113 69
                                                                                                                                                                    |
                                                                                                                                                                    27天前
                                                                                                                                                                    |
                                                                                                                                                                    Python
                                                                                                                                                                    [oeasy]python050_如何删除变量_del_delete_variable
                                                                                                                                                                    本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
                                                                                                                                                                    111 68
                                                                                                                                                                    |
                                                                                                                                                                    7天前
                                                                                                                                                                    |
                                                                                                                                                                    Python
                                                                                                                                                                    [oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
                                                                                                                                                                    本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
                                                                                                                                                                    29 14
                                                                                                                                                                    |
                                                                                                                                                                    2天前
                                                                                                                                                                    |
                                                                                                                                                                    存储 Python
                                                                                                                                                                    [oeasy]python056_python中下划线是什么意思_underscore_理解_声明与赋值_改名字
                                                                                                                                                                    在Python中,下划线有多种用途。单下划线(_)常用于避免命名冲突,如将`max`改为`max_`以保留内置函数功能。双下划线(__var__)通常用于特殊方法和属性,如`__name__`、`__doc__`等。此外,单下划线(_)在交互式解释器中表示上一次表达式的值,但不建议作为普通变量名使用。总结:下划线用于避免命名冲突及特殊标识。
                                                                                                                                                                    9 1
                                                                                                                                                                    |
                                                                                                                                                                    16天前
                                                                                                                                                                    |
                                                                                                                                                                    C语言 Python
                                                                                                                                                                    [oeasy]python054_python有哪些关键字_keyword_list_列表_reserved_words
                                                                                                                                                                    本文介绍了Python的关键字列表及其使用规则。通过回顾`hello world`示例,解释了Python中的标识符命名规则,并探讨了关键字如`if`、`for`、`in`等不能作为变量名的原因。最后,通过`import keyword`和`print(keyword.kwlist)`展示了Python的所有关键字,并总结了关键字不能用作标识符的规则。
                                                                                                                                                                    29 9
                                                                                                                                                                    |
                                                                                                                                                                    24天前
                                                                                                                                                                    |
                                                                                                                                                                    Unix 编译器 C语言
                                                                                                                                                                    [oeasy]python052_[系统开发语言为什么默认是c语言
                                                                                                                                                                    本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
                                                                                                                                                                    26 5
                                                                                                                                                                    |
                                                                                                                                                                    29天前
                                                                                                                                                                    |
                                                                                                                                                                    Shell Python
                                                                                                                                                                    [oeasy]python049_[词根溯源]locals_现在都定义了哪些变量
                                                                                                                                                                    本文介绍了Python中`locals()`函数的使用方法及其在调试中的作用。通过回顾变量赋值、连等赋值、解包赋值等内容,文章详细解释了如何利用`locals()`函数查看当前作用域内的本地变量,并探讨了变量声明前后以及导入模块对本地变量的影响。最后,文章还涉及了一些与“local”相关的英语词汇,如`locate`、`allocate`等,帮助读者更好地理解“本地”概念在编程及日常生活中的应用。
                                                                                                                                                                    35 9
                                                                                                                                                                    |
                                                                                                                                                                    1月前
                                                                                                                                                                    |
                                                                                                                                                                    Python 容器
                                                                                                                                                                    [oeasy]python048_用变量赋值_连等赋值_解包赋值_unpack_assignment _
                                                                                                                                                                    本文介绍了Python中变量赋值的不同方式,包括使用字面量和另一个变量进行赋值。通过`id()`函数展示了变量在内存中的唯一地址,并探讨了变量、模块、函数及类类型的地址特性。文章还讲解了连等赋值和解包赋值的概念,以及如何查看已声明的变量。最后总结了所有对象(如变量、模块、函数、类)都有其类型且在内存中有唯一的引用地址,构成了Python系统的基石。
                                                                                                                                                                    30 5
                                                                                                                                                                    |
                                                                                                                                                                    2月前
                                                                                                                                                                    |
                                                                                                                                                                    存储 Python 容器
                                                                                                                                                                    [oeasy]python045_[词根溯源]赋值_assignment_usage_使用
                                                                                                                                                                    本文回顾了上一次讲解的内容,重点讨论了变量的概念及其在各种系统和游戏中的应用。文章详细解释了变量的声明与赋值操作,强调了赋值即为将具体值存储到变量名下的过程。同时,通过例子说明了字面量(如数字0)不能被赋值给其他值的原因。此外,还探讨了“赋值”一词的来源及其英文表达“assignment”的含义,并简要介绍了与之相关的英语词汇,如sign、assign、signal等。最后,总结了本次课程的核心内容,即赋值操作的定义和实现方式。
                                                                                                                                                                    29 3