[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

简介: [oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

拉丁字符 回忆上次内容

  • 上次回顾了字型编码的进化过程
  • 7-bit 的 点阵字库
  • 终于让 字母、数字、标点 明确了字型



  • 但是 7-bit 的 ascii中
  • 没有法文字符的位置


添加图片注释,不超过 140 字(可选)

  • 如果扩展位为1
  • 不同的计算机厂商
  • 有各自不同的 扩展方式



  • 这噩梦
  • 比法语不兼容 更可怕!😱
  • 这以后 编码就越来越多了
  • 互认对方为乱码


  • 法文字符
  • 完全被 不同的字符集
  • 直接 变成乱码



  • 这可怎么办呢?🤔

那可是法国啊!

  • 法国毕竟 曾是 与英国全球争霸的对手

添加图片注释,不超过 140 字(可选)

  • 美国 从英国独立 最早靠的
  • 还是 富兰克林来法国
  • 找路易十五要的 军事和经济支持


  • 现在美国字符集ascii里面
  • 没有法文字符的位置?



  • 伤心的法国人 不由得回忆起那场海战

特拉法尔加海战

  • 如果当年法国拿破仑选用富尔顿的火轮船
  • 那特拉法尔加海战会被改写


  • 如果 结局改写
  • 美利坚 可能是 法国殖民地


添加图片注释,不超过 140 字(可选)

  • 英国应该 无法和法国 在海上争霸
  • 最终 世界语言是法语
  • 美国 入学考的不是TOEFL
  • 而是 TOFFL


添加图片注释,不超过 140 字(可选)

  • 再往前
  • 英国就更非主流了


征服者威廉

  • 法兰克王国 诺曼地区的公爵威廉
  • 跨过英吉利海峡
  • 成了 不列颠岛的征服者威廉



添加图片注释,不超过 140 字(可选)

  • 不列颠岛 北高南低
  • 挡住北边的冷风
  • 非常 适合生存
  • 从来就 不乏 征服者


英伦

  • 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
  • 英格兰岛的名字 来自于 盎格鲁部落
  • 当时昂撒 是 凯尔特人 搬来的救兵
  • 假途灭虢 占了这个南方平坦的宝岛
  • 说 这是我们盎格鲁人的岛
  • England


  • 盎格鲁岛人说的语言
  • English



添加图片注释,不超过 140 字(可选)

  • 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
  • 从不希望 欧洲大陆出现强大的帝国
  • 那就会 威胁到岛上的安全


  • 英国对于 欧洲各国制衡之术
  • 又被后来的美国 学去制衡 整个欧亚大陆


  • 不过说到底 所有文化的开局 都是从非洲走出来的
  • 最最开始都是 从无机物 偶然变成 有机物


  • 但是 电子信息化到数字化 是一个新的大环境
  • 法文字符 的编码方式 会统一 吗?


  • 先回顾 ASCII的基本情况

ascii

  • 目前最熟悉的编码是 ascii编码
  • 包括控制字符、大小写字符、数字、符号


  • 字节中 第 1 位 为 0
  • 后 7 位
  • 0x00-0x7F


  • 这里面 没有法文字符


添加图片注释,不超过 140 字(可选)

  • 但如果第 1 位是 1
  • 又会如何呢?


尝试输出

  • 找到一个数字 0xa7
  • 找到 数字对应的字符
  • 这是个 章节符号


添加图片注释,不超过 140 字(可选)

  • 也可以形成
  • 一个闭环


闭环

  • 这规律
  • 和ascii 一样的
  • 也就是说 这个字节里面除了 ascii 的 128 个字符之外
  • 还可以 有一定的
  • 还可以 对应更多字符



添加图片注释,不超过 140 字(可选)

  • 等于是 把ascii编码 给扩展了

编码格式

  • 跨国跨语言的事情 怎么办?
  • 还是要 看用户数量


添加图片注释,不超过 140 字(可选)

  • Dec公司的 VT100
  • 质量 过硬
  • 价格 实惠
  • 终成 新一代机皇


机皇的影响力

  • 新的终端
  • 就必须兼容VT100
  • 包括VT100中 一项新功能


添加图片注释,不超过 140 字(可选)

  • 这CSI
  • 不就是 控制序列\e 吗?


事实上的标准

  • VT100 是当时 最流行的终端
  • 不但支持 常用的转义字符
  • 还创造出 VT100控制码


\033[0m        // 关闭所有属性 \033[1m        // 设置为高亮 \033[4m        // 下划线 \033[5m        // 闪烁 \033[7m        // 反显 \033[8m        // 消隐 \033[nA        // 光标上移 n 行 \033[nB        // 光标下移 n 行 \033[nC        // 光标右移 n 行 \033[nD        // 光标左移 n 行 \033[y;xH    // 设置光标位置 \033[2J        // 清屏

  • 这就是 后来CSI的雏形 😁
  • Control Sequence Introducer


  • 有了这个 就可以控制
  • 字体
  • 位置
  • 颜色


  • 慢慢 DEC的VT100标准
  • 就成了 计算机终端的标准


ISO组织

  • 总部在 瑞士日内瓦湖的 ISO组织
  • 负责 跨国跨公司的标准化
  • 在Dec所用 编码格式的基础 上
  • 发展出 iso-8859-1 字符集



  • 为什么 选择Dec的 编码格式?
  • 因为 VT100是 当时的 一代机皇
  • 用户数量 就是 事实上的标准


添加图片注释,不超过 140 字(可选)

  • 根据 dec公司的 字符集
  • 生成了 扩展ascii字符集(charset)


  • 前一半(0-127)
  • 没有动
  • 还是ascii


  • 后一半(128-255)
  • 换成了 西欧北欧各国拉丁字符


  • 这个 编码
  • 叫做 iso-8859-1
  • 也叫做 latin-1


  • latin-1覆盖的 范围如何呢?

覆盖范围

  • 西欧北欧语族都可以覆盖到
  • 拉丁人的罗曼语族(法意西葡)
  • 日耳曼人的日耳曼语族(瑞丹挪德冰)
  • 凯尔特人的盖尔语族(苏爱)


添加图片注释,不超过 140 字(可选)

latin-1

  • 拉丁语(法意西葡)我们好理解
  • 拉丁正宗


添加图片注释,不超过 140 字(可选)

  • 北欧 这么多国家
  • 为什么 都使用拉丁字符呢?


  • 北欧 不是有 自己的一套符文系统吗?

添加图片注释,不超过 140 字(可选)

  • 日耳曼语族 不是和 拉丁语族 并列的吗?

总结

  • 这次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1


添加图片注释,不超过 140 字(可选)


目录
打赏
0
0
0
0
9
分享
相关文章
[oeasy]python062_在python中完成输入和输出_input_print
本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
129 66
[oeasy]python065python报错怎么办_try_试着来_except_发现异常
本文介绍了Python中处理异常的基本方法,重点讲解了`try`和`except`的用法。通过一个计算苹果重量的小程序示例,展示了如何捕获用户输入错误并进行处理。主要内容包括: 1. **回顾上次内容**:简要回顾了Shell环境、Python3游乐场和Vim编辑器的使用。 2. **编写程序**:编写了一个简单的程序来计算苹果的总重量,但发现由于输入类型问题导致结果错误。 3. **调试与修正**:通过调试发现输入函数返回的是字符串类型,需要将其转换为整数类型才能正确计算。
51 32
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
25 8
[oeasy]python066_如何捕获多个异常_try_否则_else_exception
本文介绍了Python中`try...except...else`结构的使用方法。主要内容包括: 1. **回顾上次内容**:简要复习了`try`和`except`的基本用法,强调了异常处理的重要性。 2. **详细解释**: - `try`块用于尝试执行代码,一旦发现错误会立即终止并跳转到`except`块。 - `except`块用于捕获特定类型的异常,并进行相应的处理。 - `else`块在没有异常时执行,是可选的。 3. **示例代码**:通过具体例子展示了如何捕获不同类型的异常(如`ValueError`和`ZeroDivisionError`),并解释了异常处理
43 24
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
128 80
[oeasy]python068_异常处理之后做些什么_try语句的完全体_最终_finally
介绍了 Python 中 `try` 语句的完全体,包括 `try`、`except`、`else` 和 `finally` 子句的使用。通过实例展示了如何捕获异常并输出详细的错误信息,如文件名和行号。特别强调了 `finally` 子句的作用,无论是否发生异常,`finally` 都会执行,常用于清理操作。最后总结了 `try` 语句的四个部分及其应用场景,并简要提及了 Python 社区的决策机制。 #try #except #else #finally
17 1
[oeasy]python064_命令行工作流的总结_vim_shell_python
本文总结了命令行工作流中的关键工具和操作,包括vim、shell和Python。主要内容如下: 1. **上次回顾**:完成了输入输出的代码编写,并再次练习了vim的使用。 2. **shell基础**:介绍了shell环境及其基本命令,如`pwd`、`cd`、`ll -l`等。 3. **Python游乐场**:通过`python3`命令进入Python交互环境,可以进行简单计算和函数调用,常用函数有`help`、`ord`、`chr`等。 4. **vim编辑器**:详细讲解了vim的三种模式(正常模式、插入模式、底行命令模式)及其切换方法,以及常用的底行命令如`:w`、`:q`、`
83 15
[oeasy]python051_什么样的变量名能用_标识符_identifier
本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
138 69
|
3月前
|
[oeasy]python050_如何删除变量_del_delete_variable
本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
130 68
[oeasy]python069_当前作用域都有些什么_列表dir_函数_builtins
本文介绍了Python中`dir()`函数的使用方法及其作用。`dir()`可以列出当前作用域内的所有变量和成员,类似于`locals()`,但`dir()`不仅限于本地变量,还能显示模块中的所有成员。通过`dir(__builtins__)`可以查看内建模块中的所有内建函数,如`print`、`ord`、`chr`等。此外,还回顾了`try-except-finally`结构在数据库连接中的应用,并解释了为何`print`函数可以直接使用而无需导入,因为它位于`__builtins__`模块中。最后,简要提及了删除`__builtins__.print`的方法及其影响。
24 0

热门文章

最新文章