[oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

简介: [oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

 

打包和解包

回忆上次内容

    • decode

     

      • 就是解码
        • 解码和编码可以转化
          • encode 编码
          • decode 解码
          • 互为逆过程
            • 大小写字母之间序号全都相差(32)10进制

            image.gif编辑

              • 这是为什么呢?🤔

              差距

                • 大写字母和小写字母
                  • 总是相差(32)10进制

                  image.gif编辑

                    • 从10进制角度看不清楚
                    • 我们从16进制的角度看看

                    16进制

                      • 正好是(0x20)16进制

                      image.gif编辑

                        • 为什么不多不少
                          • 就差 0x20 呢?
                          • 怎么那么寸呢?🤔
                            • 转化为2进制之后
                              • 恰好是1位(bit)
                                • 这是偶然的吗?

                                ASCII 码表趣事

                                  • 其实最初相差的并不是 0x20
                                    • 之前 ibm 的 EBCDIC 编码也是这样的

                                    正在上传…重新上传取消

                                      • 也相差一个2进制位

                                      image.gif编辑

                                        • EBCDIC问题是字母不连续
                                          • i、j之间不直接相连
                                            • EBCDIC最终被ascii所淘汰

                                            ASCII

                                              • ASCII字母是连续的
                                                • 而且大小写字母间
                                                • 相差正好是 1个 二进制位
                                                • 对应 b6 这个位
                                                  • 那为什么要差 1个 二进制位 呢?

                                                  image.gif编辑

                                                    • 有了这种对应关系之后
                                                      • 做大小写不敏感的字符串查找就快多了
                                                      • 这个 0x20 发生在 1963 年 5 月
                                                        • The X3.2.4 task group voted its approval for the change to ASCII at its May 1963 meeting.
                                                        • Locating the lowercase letters in columns 6 and 7 caused the characters to differ in bit pattern from the upper case by a single bit, which simplified case-insensitive character matching and the construction of keyboards and printers.
                                                          • 当时的目的是
                                                            • 降低大小写不敏感字符串匹配的难度
                                                            • 降低打字机键盘的构造成本
                                                              • 如果搜索中遇到的是小写字母
                                                                • 修改1位之后
                                                                  • 小写就都变成大写
                                                                  • 不用查找对应关系表匹配
                                                                    • 然后再观察全大写的情况下是否匹配
                                                                      • 这就是大小写字母的情况
                                                                        • 0x41-0x5A这个范围是大写字母
                                                                        • 0x61-0x7A这个范围是小写字母
                                                                          • 除了大小写字母之外
                                                                            • 数字字符又是如何表示的呢?

                                                                            ASCII 码表范围

                                                                            image.gif编辑

                                                                              • 0x30-0x39这个范围是数字
                                                                                • 数字的编码减去0x30正好得到数字本身
                                                                                • 后四位刚好是BCD编码模式
                                                                                  • Binary-Coded Decimal

                                                                                  image.gif编辑

                                                                                    • 我们再来看看 ASCII 除了字母和数字还有什么?

                                                                                    各种符号

                                                                                      • 各种符号是不连续的

                                                                                      image.gif编辑

                                                                                        • 穿插在数字、字母周围
                                                                                          • sp 其实就是space(空格)
                                                                                            • 表格最左边是什么呢?

                                                                                            ASCII

                                                                                              • 0x20-0x7F 之间有各种真实字符

                                                                                              image.gif编辑

                                                                                                • 0x00-0x1F 之间的东西是什么?
                                                                                                  • 前两列都是对应多个字符的
                                                                                                    • 具体含义目前还不知道
                                                                                                      • ASCII中的字符本来英语里就有
                                                                                                        • 但是字符是英文字符、数字和标点
                                                                                                          • 怎么编码的呢?

                                                                                                          ASCII由来

                                                                                                            • ASCII码是由电报代码发展而来的

                                                                                                            正在上传…重新上传取消

                                                                                                              • 由贝尔数据服务公司推广

                                                                                                              image.gif编辑

                                                                                                                • 电报码不是摩斯电码吗?

                                                                                                                摩斯电码

                                                                                                                  • 更早之前确实是摩斯电码
                                                                                                                  • 下图是他的编码表
                                                                                                                    • 分成长和短两种信号,就是嘀和嗒

                                                                                                                    image.gif编辑

                                                                                                                        • 欢迎您有机会来看看oeasy电学、科学史那几个系列
                                                                                                                          • 还记得encode/decode中的code么?
                                                                                                                            • 曾经一度指的就是各种电报编码汇编
                                                                                                                            • 后来统一到摩斯电码

                                                                                                                            摩斯电码通信规则

                                                                                                                              • 下图是他的通信规则
                                                                                                                                • 三个断确认本字符结束了
                                                                                                                                • 三个断就是字符之间的分隔符
                                                                                                                                • 录入状态并不是 0、1 两种状态
                                                                                                                                • 而是长、短、暂停三种状态

                                                                                                                                image.gif编辑

                                                                                                                                  • 编码的原则是什么呢?

                                                                                                                                  效率问题

                                                                                                                                    • 编码的规则是常用的字符点击次数少
                                                                                                                                      • 按照字符出现概率分配对应点击数量
                                                                                                                                        • TE 出现频率最高
                                                                                                                                        • 所以用一次点击电键的数量
                                                                                                                                          • 本质上是一棵霍夫曼树

                                                                                                                                          image.gif编辑

                                                                                                                                            • 当时发射和接收全靠人
                                                                                                                                              • 什么叫长、什么叫短、什么叫断
                                                                                                                                                • 发送者控制发报速度
                                                                                                                                                  • 接收者跟着这个发报速度
                                                                                                                                                  • 现查表是来不及的
                                                                                                                                                  • 需要熟悉
                                                                                                                                                    • 摩斯电码码表
                                                                                                                                                    • 常用缩写
                                                                                                                                                      • 这摩斯电码是3进制的编码方式
                                                                                                                                                      • 怎么变成ascii这种0101的二进制编码的呢?

                                                                                                                                                      总结

                                                                                                                                                        • ASCII 由这样几类字符构成
                                                                                                                                                          • 英文大写字符
                                                                                                                                                          • 英文小写字符
                                                                                                                                                          • 数字
                                                                                                                                                          • 符号
                                                                                                                                                            • 电报时代对于英文、数字的编码
                                                                                                                                                              • 使用的是摩斯电码

                                                                                                                                                              image.gif编辑

                                                                                                                                                                • 这摩斯电码是3进制的编码方式
                                                                                                                                                                  • 长短空
                                                                                                                                                                    相关文章
                                                                                                                                                                    |
                                                                                                                                                                    26天前
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 Shell 开发工具
                                                                                                                                                                    [oeasy]python062_在python中完成输入和输出_input_print
                                                                                                                                                                    本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
                                                                                                                                                                    115 66
                                                                                                                                                                    |
                                                                                                                                                                    5天前
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 Shell 开发工具
                                                                                                                                                                    [oeasy]python065python报错怎么办_try_试着来_except_发现异常
                                                                                                                                                                    本文介绍了Python中处理异常的基本方法,重点讲解了`try`和`except`的用法。通过一个计算苹果重量的小程序示例,展示了如何捕获用户输入错误并进行处理。主要内容包括: 1. **回顾上次内容**:简要回顾了Shell环境、Python3游乐场和Vim编辑器的使用。 2. **编写程序**:编写了一个简单的程序来计算苹果的总重量,但发现由于输入类型问题导致结果错误。 3. **调试与修正**:通过调试发现输入函数返回的是字符串类型,需要将其转换为整数类型才能正确计算。
                                                                                                                                                                    48 32
                                                                                                                                                                    |
                                                                                                                                                                    2天前
                                                                                                                                                                    |
                                                                                                                                                                    数据库 Python
                                                                                                                                                                    [oeasy]python066_如何捕获多个异常_try_否则_else_exception
                                                                                                                                                                    本文介绍了Python中`try...except...else`结构的使用方法。主要内容包括: 1. **回顾上次内容**:简要复习了`try`和`except`的基本用法,强调了异常处理的重要性。 2. **详细解释**: - `try`块用于尝试执行代码,一旦发现错误会立即终止并跳转到`except`块。 - `except`块用于捕获特定类型的异常,并进行相应的处理。 - `else`块在没有异常时执行,是可选的。 3. **示例代码**:通过具体例子展示了如何捕获不同类型的异常(如`ValueError`和`ZeroDivisionError`),并解释了异常处理
                                                                                                                                                                    33 24
                                                                                                                                                                    |
                                                                                                                                                                    2月前
                                                                                                                                                                    |
                                                                                                                                                                    Unix Linux 程序员
                                                                                                                                                                    [oeasy]python053_学编程为什么从hello_world_开始
                                                                                                                                                                    视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
                                                                                                                                                                    126 80
                                                                                                                                                                    |
                                                                                                                                                                    8天前
                                                                                                                                                                    |
                                                                                                                                                                    缓存 Shell 开发工具
                                                                                                                                                                    [oeasy]python064_命令行工作流的总结_vim_shell_python
                                                                                                                                                                    本文总结了命令行工作流中的关键工具和操作,包括vim、shell和Python。主要内容如下: 1. **上次回顾**:完成了输入输出的代码编写,并再次练习了vim的使用。 2. **shell基础**:介绍了shell环境及其基本命令,如`pwd`、`cd`、`ll -l`等。 3. **Python游乐场**:通过`python3`命令进入Python交互环境,可以进行简单计算和函数调用,常用函数有`help`、`ord`、`chr`等。 4. **vim编辑器**:详细讲解了vim的三种模式(正常模式、插入模式、底行命令模式)及其切换方法,以及常用的底行命令如`:w`、`:q`、`
                                                                                                                                                                    45 15
                                                                                                                                                                    |
                                                                                                                                                                    2月前
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 C语言 Python
                                                                                                                                                                    [oeasy]python051_什么样的变量名能用_标识符_identifier
                                                                                                                                                                    本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
                                                                                                                                                                    126 69
                                                                                                                                                                    |
                                                                                                                                                                    2月前
                                                                                                                                                                    |
                                                                                                                                                                    Python
                                                                                                                                                                    [oeasy]python050_如何删除变量_del_delete_variable
                                                                                                                                                                    本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
                                                                                                                                                                    126 68
                                                                                                                                                                    |
                                                                                                                                                                    1月前
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 Unix Java
                                                                                                                                                                    [oeasy]python059变量命名有什么规则_惯用法_蛇形命名法_name_convention_snake
                                                                                                                                                                    本文探讨了Python中变量命名的几种常见方式,包括汉语拼音变量名、蛇形命名法(snake_case)和驼峰命名法(CamelCase)。回顾上次内容,我们主要讨论了使用下划线替代空格以提高代码可读性。实际编程中,当变量名由多个单词组成时,合理的命名惯例变得尤为重要。
                                                                                                                                                                    84 9
                                                                                                                                                                    |
                                                                                                                                                                    1月前
                                                                                                                                                                    |
                                                                                                                                                                    C语言 Python
                                                                                                                                                                    [oeasy]python058_一句话让python崩了
                                                                                                                                                                    本文介绍了如何通过重新赋值`__builtins__`使Python环境崩溃,并探讨了下划线的来历及其在编程中的作用。文章回顾了上次内容,展示了覆盖内建模块导致系统崩溃的过程,解释了恢复方法,以及PEP 8规范中关于空格使用的建议。最后,文章总结了下划线在变量定义和提高代码可读性方面的重要性,并简述了其从打字机时代到计算机时代的演变。
                                                                                                                                                                    34 10
                                                                                                                                                                    |
                                                                                                                                                                    2月前
                                                                                                                                                                    |
                                                                                                                                                                    Python
                                                                                                                                                                    [oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
                                                                                                                                                                    本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
                                                                                                                                                                    51 14

                                                                                                                                                                    热门文章

                                                                                                                                                                    最新文章