[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

简介: [oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

拉丁字符 回忆上次内容

  • 上次回顾了字型编码的进化过程
  • 7-bit 的 点阵字库
  • 终于让 字母、数字、标点 明确了字型



  • 但是 7-bit 的 ascii中
  • 没有法文字符的位置


添加图片注释,不超过 140 字(可选)

  • 如果扩展位为1
  • 不同的计算机厂商
  • 有各自不同的 扩展方式



  • 这噩梦
  • 比法语不兼容 更可怕!😱
  • 这以后 编码就越来越多了
  • 互认对方为乱码


  • 法文字符
  • 完全被 不同的字符集
  • 直接 变成乱码



  • 这可怎么办呢?🤔

那可是法国啊!

  • 法国毕竟 曾是 与英国全球争霸的对手

添加图片注释,不超过 140 字(可选)

  • 美国 从英国独立 最早靠的
  • 还是 富兰克林来法国
  • 找路易十五要的 军事和经济支持


  • 现在美国字符集ascii里面
  • 没有法文字符的位置?



  • 伤心的法国人 不由得回忆起那场海战

特拉法尔加海战

  • 如果当年法国拿破仑选用富尔顿的火轮船
  • 那特拉法尔加海战会被改写


  • 如果 结局改写
  • 美利坚 可能是 法国殖民地


添加图片注释,不超过 140 字(可选)

  • 英国应该 无法和法国 在海上争霸
  • 最终 世界语言是法语
  • 美国 入学考的不是TOEFL
  • 而是 TOFFL


添加图片注释,不超过 140 字(可选)

  • 再往前
  • 英国就更非主流了


征服者威廉

  • 法兰克王国 诺曼地区的公爵威廉
  • 跨过英吉利海峡
  • 成了 不列颠岛的征服者威廉



添加图片注释,不超过 140 字(可选)

  • 不列颠岛 北高南低
  • 挡住北边的冷风
  • 非常 适合生存
  • 从来就 不乏 征服者


英伦

  • 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
  • 英格兰岛的名字 来自于 盎格鲁部落
  • 当时昂撒 是 凯尔特人 搬来的救兵
  • 假途灭虢 占了这个南方平坦的宝岛
  • 说 这是我们盎格鲁人的岛
  • England


  • 盎格鲁岛人说的语言
  • English



添加图片注释,不超过 140 字(可选)

  • 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
  • 从不希望 欧洲大陆出现强大的帝国
  • 那就会 威胁到岛上的安全


  • 英国对于 欧洲各国制衡之术
  • 又被后来的美国 学去制衡 整个欧亚大陆


  • 不过说到底 所有文化的开局 都是从非洲走出来的
  • 最最开始都是 从无机物 偶然变成 有机物


  • 但是 电子信息化到数字化 是一个新的大环境
  • 法文字符 的编码方式 会统一 吗?


  • 先回顾 ASCII的基本情况

ascii

  • 目前最熟悉的编码是 ascii编码
  • 包括控制字符、大小写字符、数字、符号


  • 字节中 第 1 位 为 0
  • 后 7 位
  • 0x00-0x7F


  • 这里面 没有法文字符


添加图片注释,不超过 140 字(可选)

  • 但如果第 1 位是 1
  • 又会如何呢?


尝试输出

  • 找到一个数字 0xa7
  • 找到 数字对应的字符
  • 这是个 章节符号


添加图片注释,不超过 140 字(可选)

  • 也可以形成
  • 一个闭环


闭环

  • 这规律
  • 和ascii 一样的
  • 也就是说 这个字节里面除了 ascii 的 128 个字符之外
  • 还可以 有一定的
  • 还可以 对应更多字符



添加图片注释,不超过 140 字(可选)

  • 等于是 把ascii编码 给扩展了

编码格式

  • 跨国跨语言的事情 怎么办?
  • 还是要 看用户数量


添加图片注释,不超过 140 字(可选)

  • Dec公司的 VT100
  • 质量 过硬
  • 价格 实惠
  • 终成 新一代机皇


机皇的影响力

  • 新的终端
  • 就必须兼容VT100
  • 包括VT100中 一项新功能


添加图片注释,不超过 140 字(可选)

  • 这CSI
  • 不就是 控制序列\e 吗?


事实上的标准

  • VT100 是当时 最流行的终端
  • 不但支持 常用的转义字符
  • 还创造出 VT100控制码


\033[0m        // 关闭所有属性 \033[1m        // 设置为高亮 \033[4m        // 下划线 \033[5m        // 闪烁 \033[7m        // 反显 \033[8m        // 消隐 \033[nA        // 光标上移 n 行 \033[nB        // 光标下移 n 行 \033[nC        // 光标右移 n 行 \033[nD        // 光标左移 n 行 \033[y;xH    // 设置光标位置 \033[2J        // 清屏

  • 这就是 后来CSI的雏形 😁
  • Control Sequence Introducer


  • 有了这个 就可以控制
  • 字体
  • 位置
  • 颜色


  • 慢慢 DEC的VT100标准
  • 就成了 计算机终端的标准


ISO组织

  • 总部在 瑞士日内瓦湖的 ISO组织
  • 负责 跨国跨公司的标准化
  • 在Dec所用 编码格式的基础 上
  • 发展出 iso-8859-1 字符集



  • 为什么 选择Dec的 编码格式?
  • 因为 VT100是 当时的 一代机皇
  • 用户数量 就是 事实上的标准


添加图片注释,不超过 140 字(可选)

  • 根据 dec公司的 字符集
  • 生成了 扩展ascii字符集(charset)


  • 前一半(0-127)
  • 没有动
  • 还是ascii


  • 后一半(128-255)
  • 换成了 西欧北欧各国拉丁字符


  • 这个 编码
  • 叫做 iso-8859-1
  • 也叫做 latin-1


  • latin-1覆盖的 范围如何呢?

覆盖范围

  • 西欧北欧语族都可以覆盖到
  • 拉丁人的罗曼语族(法意西葡)
  • 日耳曼人的日耳曼语族(瑞丹挪德冰)
  • 凯尔特人的盖尔语族(苏爱)


添加图片注释,不超过 140 字(可选)

latin-1

  • 拉丁语(法意西葡)我们好理解
  • 拉丁正宗


添加图片注释,不超过 140 字(可选)

  • 北欧 这么多国家
  • 为什么 都使用拉丁字符呢?


  • 北欧 不是有 自己的一套符文系统吗?

添加图片注释,不超过 140 字(可选)

  • 日耳曼语族 不是和 拉丁语族 并列的吗?

总结

  • 这次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1


添加图片注释,不超过 140 字(可选)


目录
相关文章
|
2月前
|
Unix 编译器 Shell
[oeasy]python0033_先有操作系统还是先有编程语言_c语言是怎么来的
本文回顾了计算机语言与操作系统的起源,探讨了早期 Unix 操作系统及其与 C 语言的相互促进发展。Unix 最初用汇编语言编写,运行在 PDP-7 上,后来 Thompson 和 Ritchie 开发了 C 语言及编译器,使 Unix 重写并成功编译。1974 年 Ritchie 发表论文,Unix 开始被学术界关注,并逐渐普及。伯克利分校也在此过程中发挥了重要作用,推动了 Unix 和 C 语言的广泛传播。
63 9
[oeasy]python0033_先有操作系统还是先有编程语言_c语言是怎么来的
|
11天前
|
人工智能 Shell 开发工具
[oeasy]python0041_输出ASCII码表_英文字符编码_键盘字符_ISO_646
本文介绍了ASCII码表的生成与使用,包括英文字符、数字和符号的编码。通过Python代码遍历0到127的ASCII值,解决了找不到竖线符号的问题,并解释了ASCII码的固定映射关系及其重要性。文章还介绍了ASCII码的历史背景,以及它如何成为国际标准ISO 646。最后,通过安装`ascii`程序展示了完整的ASCII码表。
12 1
|
22天前
|
人工智能 Python
[oeasy]python039_for循环_循环遍历_循环变量
本文回顾了上一次的内容,介绍了小写和大写字母的序号范围,并通过 `range` 函数生成了 `for` 循环。重点讲解了 `range(start, stop)` 的使用方法,解释了为什么不会输出 `stop` 值,并通过示例展示了如何遍历小写和大写字母的序号。最后总结了 `range` 函数的结构和 `for` 循环的使用技巧。
31 4
|
29天前
|
存储 Python
[oeasy]python038_ range函数_大小写字母的起止范围_start_stop
本文介绍了Python中`range`函数的使用方法及其在生成大小写字母序号范围时的应用。通过示例展示了如何利用`range`和`for`循环输出指定范围内的数字,重点讲解了小写和大写字母对应的ASCII码值范围,并解释了`range`函数的参数(start, stop)以及为何不包括stop值的原因。最后,文章留下了关于为何`range`不包含stop值的问题,留待下一次讨论。
21 1
|
15天前
|
人工智能 开发工具 Python
[oeasy]python040_缩进几个字符好_输出所有键盘字符_循环遍历_indent
本文探讨了Python代码中的缩进问题。通过研究`range`函数和`for`循环,发现缩进对于代码块的执行至关重要。如果缩进不正确,程序会抛出`IndentationError`。文章还介绍了Python的PEP8规范,推荐使用4个空格进行缩进,并通过示例展示了如何使用Tab键实现标准缩进。最后,通过修改代码,输出了从0到122的字符及其对应的ASCII码值,但未能找到竖线符号(`|`)。文章在总结中提到,下次将继续探讨竖线符号的位置。
12 0
|
1月前
|
Python
[oeasy]python036_数据类型有什么用_type_类型_int_str_查看帮助
本文回顾了Python中`ord()`和`chr()`函数的使用方法,强调了这两个函数互为逆运算:`ord()`通过字符找到对应的序号,`chr()`则通过序号找到对应的字符。文章详细解释了函数参数类型的重要性,即`ord()`需要字符串类型参数,而`chr()`需要整数类型参数。若参数类型错误,则会引发`TypeError`。此外,还介绍了如何使用`type()`函数查询参数类型,并通过示例展示了如何正确使用`ord()`和`chr()`进行转换。最后,强调了在函数调用时正确传递参数类型的重要性。
22 3
|
1月前
|
存储 C++ Python
[oeasy]python037_ print函数参数_sep分隔符_separator
本文介绍了Python中`print`函数的`sep`参数,即分隔符。通过回顾上文内容,解释了类型与`type`的概念,并强调了参数类型的重要性。文章详细探讨了`print`函数如何使用`sep`参数来分隔输出值,默认分隔符为空格(序号32)。还讨论了如何修改分隔符为其他字符,如冒号,并解释了为何反斜杠需要使用双反斜杠表示。最后,文章追溯了`sep`名称的由来,以及相关词汇的历史背景,如盎格鲁-萨克逊人的武器和语言。
35 0
|
2月前
|
Python
[oeasy]python035_根据序号得到字符_chr函数_字符_character_
本文介绍了Python中的`ord()`和`chr()`函数。`ord()`函数通过字符找到对应的序号,而`chr()`函数则根据序号找到对应的字符。两者互为逆运算,可以相互转换。文章还探讨了单双引号在字符串中的作用,并解释了中文字符和emoji也有对应的序号。最后总结了`ord()`和`chr()`函数的特点,并提供了学习资源链接。
29 4
|
3月前
|
算法 Unix 程序员
[oeasy]python031_[趣味拓展]unix起源_Ken_Tompson_Ritchie_multics
回顾了上次内容关于调试的基本概念后,本文介绍了Unix操作系统的起源。从早期计算机任务的独占执行方式讲起,到1960年代 Dartmouth 开发出分时算法,使得一台主机能够面对多个终端,轮流使用CPU时间片。随后,贝尔实验室、通用电气和MIT合作开展Multics项目,项目成员Kenneth Thompson与Dennis Ritchie在此期间开发了一款名为《Space Travel》的游戏。然而,因金融动荡等原因,Multics项目最终被裁撤。Thompson和Ritchie后来利用实验室闲置的一台PDP-7计算机仅用三周时间就开发出了Unix操作系统的第一版,初衷是为了能够继续玩游戏。
42 3
|
2月前
|
Unix 编译器 C语言
[oeasy]python034_计算机是如何认识abc的_ord函数_字符序号_ordinal_
[oeasy]python034_计算机是如何认识abc的_ord函数_字符序号_ord
24 0
下一篇
无影云桌面