[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

简介: [oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

拉丁字符 回忆上次内容

  • 上次回顾了字型编码的进化过程
  • 7-bit 的 点阵字库
  • 终于让 字母、数字、标点 明确了字型



  • 但是 7-bit 的 ascii中
  • 没有法文字符的位置


添加图片注释,不超过 140 字(可选)

  • 如果扩展位为1
  • 不同的计算机厂商
  • 有各自不同的 扩展方式



  • 这噩梦
  • 比法语不兼容 更可怕!😱
  • 这以后 编码就越来越多了
  • 互认对方为乱码


  • 法文字符
  • 完全被 不同的字符集
  • 直接 变成乱码



  • 这可怎么办呢?🤔

那可是法国啊!

  • 法国毕竟 曾是 与英国全球争霸的对手

添加图片注释,不超过 140 字(可选)

  • 美国 从英国独立 最早靠的
  • 还是 富兰克林来法国
  • 找路易十五要的 军事和经济支持


  • 现在美国字符集ascii里面
  • 没有法文字符的位置?



  • 伤心的法国人 不由得回忆起那场海战

特拉法尔加海战

  • 如果当年法国拿破仑选用富尔顿的火轮船
  • 那特拉法尔加海战会被改写


  • 如果 结局改写
  • 美利坚 可能是 法国殖民地


添加图片注释,不超过 140 字(可选)

  • 英国应该 无法和法国 在海上争霸
  • 最终 世界语言是法语
  • 美国 入学考的不是TOEFL
  • 而是 TOFFL


添加图片注释,不超过 140 字(可选)

  • 再往前
  • 英国就更非主流了


征服者威廉

  • 法兰克王国 诺曼地区的公爵威廉
  • 跨过英吉利海峡
  • 成了 不列颠岛的征服者威廉



添加图片注释,不超过 140 字(可选)

  • 不列颠岛 北高南低
  • 挡住北边的冷风
  • 非常 适合生存
  • 从来就 不乏 征服者


英伦

  • 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
  • 英格兰岛的名字 来自于 盎格鲁部落
  • 当时昂撒 是 凯尔特人 搬来的救兵
  • 假途灭虢 占了这个南方平坦的宝岛
  • 说 这是我们盎格鲁人的岛
  • England


  • 盎格鲁岛人说的语言
  • English



添加图片注释,不超过 140 字(可选)

  • 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
  • 从不希望 欧洲大陆出现强大的帝国
  • 那就会 威胁到岛上的安全


  • 英国对于 欧洲各国制衡之术
  • 又被后来的美国 学去制衡 整个欧亚大陆


  • 不过说到底 所有文化的开局 都是从非洲走出来的
  • 最最开始都是 从无机物 偶然变成 有机物


  • 但是 电子信息化到数字化 是一个新的大环境
  • 法文字符 的编码方式 会统一 吗?


  • 先回顾 ASCII的基本情况

ascii

  • 目前最熟悉的编码是 ascii编码
  • 包括控制字符、大小写字符、数字、符号


  • 字节中 第 1 位 为 0
  • 后 7 位
  • 0x00-0x7F


  • 这里面 没有法文字符


添加图片注释,不超过 140 字(可选)

  • 但如果第 1 位是 1
  • 又会如何呢?


尝试输出

  • 找到一个数字 0xa7
  • 找到 数字对应的字符
  • 这是个 章节符号


添加图片注释,不超过 140 字(可选)

  • 也可以形成
  • 一个闭环


闭环

  • 这规律
  • 和ascii 一样的
  • 也就是说 这个字节里面除了 ascii 的 128 个字符之外
  • 还可以 有一定的
  • 还可以 对应更多字符



添加图片注释,不超过 140 字(可选)

  • 等于是 把ascii编码 给扩展了

编码格式

  • 跨国跨语言的事情 怎么办?
  • 还是要 看用户数量


添加图片注释,不超过 140 字(可选)

  • Dec公司的 VT100
  • 质量 过硬
  • 价格 实惠
  • 终成 新一代机皇


机皇的影响力

  • 新的终端
  • 就必须兼容VT100
  • 包括VT100中 一项新功能


添加图片注释,不超过 140 字(可选)

  • 这CSI
  • 不就是 控制序列\e 吗?


事实上的标准

  • VT100 是当时 最流行的终端
  • 不但支持 常用的转义字符
  • 还创造出 VT100控制码


\033[0m        // 关闭所有属性 \033[1m        // 设置为高亮 \033[4m        // 下划线 \033[5m        // 闪烁 \033[7m        // 反显 \033[8m        // 消隐 \033[nA        // 光标上移 n 行 \033[nB        // 光标下移 n 行 \033[nC        // 光标右移 n 行 \033[nD        // 光标左移 n 行 \033[y;xH    // 设置光标位置 \033[2J        // 清屏

  • 这就是 后来CSI的雏形 😁
  • Control Sequence Introducer


  • 有了这个 就可以控制
  • 字体
  • 位置
  • 颜色


  • 慢慢 DEC的VT100标准
  • 就成了 计算机终端的标准


ISO组织

  • 总部在 瑞士日内瓦湖的 ISO组织
  • 负责 跨国跨公司的标准化
  • 在Dec所用 编码格式的基础 上
  • 发展出 iso-8859-1 字符集



  • 为什么 选择Dec的 编码格式?
  • 因为 VT100是 当时的 一代机皇
  • 用户数量 就是 事实上的标准


添加图片注释,不超过 140 字(可选)

  • 根据 dec公司的 字符集
  • 生成了 扩展ascii字符集(charset)


  • 前一半(0-127)
  • 没有动
  • 还是ascii


  • 后一半(128-255)
  • 换成了 西欧北欧各国拉丁字符


  • 这个 编码
  • 叫做 iso-8859-1
  • 也叫做 latin-1


  • latin-1覆盖的 范围如何呢?

覆盖范围

  • 西欧北欧语族都可以覆盖到
  • 拉丁人的罗曼语族(法意西葡)
  • 日耳曼人的日耳曼语族(瑞丹挪德冰)
  • 凯尔特人的盖尔语族(苏爱)


添加图片注释,不超过 140 字(可选)

latin-1

  • 拉丁语(法意西葡)我们好理解
  • 拉丁正宗


添加图片注释,不超过 140 字(可选)

  • 北欧 这么多国家
  • 为什么 都使用拉丁字符呢?


  • 北欧 不是有 自己的一套符文系统吗?

添加图片注释,不超过 140 字(可选)

  • 日耳曼语族 不是和 拉丁语族 并列的吗?

总结

  • 这次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1


添加图片注释,不超过 140 字(可选)


目录
相关文章
C4.
|
2月前
|
存储 Python
Python字符编码
Python字符编码
C4.
20 1
|
2月前
|
人工智能 Shell 程序员
[oeasy]python005_退出游乐场_重启游乐场_系统态shell_应用态_quit
[oeasy]python005_退出游乐场_重启游乐场_系统态shell_应用态_quit
30 0
|
2月前
|
程序员 开发工具 Python
[oeasy]python017_万行代码之梦_vim环境_复制粘贴
在这个教程中,作者分享了如何在 Vim 编辑器中快速创建和操作大量代码行。首先,通过 `yy` 复制一行,然后使用 `p` 粘贴来增加代码行数。通过反复粘贴,可以迅速生成多行代码。为了加快操作,可以用 `9999p` 来一次性粘贴9999行。接着,介绍了撤销(`u`)和重做(`ctrl+r`)的操作,以及删除整篇文档的快捷方式。最后,作者提到虽然可以生成一万行代码,但并不建议这样做,因为可能会导致程序崩溃,并提醒大家适度编程。
82 2
|
2月前
|
缓存 Shell 开发工具
[oeasy]python0012_程序写错了怎么办
这段内容主要讲述了如何处理Python文件运行时的`NameError`。首先,使用`vi`编辑器
40 0
|
2月前
|
Shell Python
[oeasy]python0003_ 终端大冒险_终端命令_whoami_pwd_ls
[oeasy]python0003_ 终端大冒险_终端命令_whoami_pwd_ls
47 5
|
7天前
|
缓存 Shell 开发工具
[oeasy]python024_vim读取文件_从头复制到尾_撤销_重做_reg_寄存器
[oeasy]python024_vim读取文件_从头复制到尾_撤销_重做_reg_寄存器
16 5
|
28天前
|
开发工具 Python
[oeasy]python0021_宝剑镶宝石_爱之石中剑_批量替换_特殊字符_特殊颜色
在这个文本中,作者描述了一个逐步修改Python游戏`game.py`的过程,以将小丑的眼睛和石中剑的图形替换为爱心符号,并且将其颜色更改为红色。以下是内容的摘要: - 用户回顾了之前对`game.py`的分析和理解。 - 通过使用方向键和编辑模式,在代码中找到了小丑眼睛和石中剑的位置,用爱心符号(❤)替换了它们。 - 如果遇到问题,建议使用最新版的火狐浏览器进行粘贴操作。 - 使用Vim编辑器的命令模式批量替换了剑柄上的数字8为爱心,使整个剑柄充满了爱心。 - 通过插入特定代码,将爱心变为红色,从而得到红色的“爱之大剑”。
17 0
|
2月前
|
人工智能 Linux 开发工具
[oeasy]python018_ 如何下载github仓库_git_clone_下载仓库
在这个文档中,作者讨论了如何继续进行编程学习,特别是关于GitHub的使用。首先,回顾了从编写简单代码到管理大量代码的过程。然后,提到了通过“保存运行一条龙”操作来处理代码,以及GitHub作为全球最大的开源软件平台的重要性。在GitHub上,用户可以找到各种软件项目,包括Linux、Python和Blender等。 作者解释了GitHub的基本操作,如点赞(star)、 fork(复制项目)和watch(关注项目更新)。还介绍了如何下载项目到本地,通过`git clone`命令复制仓库的URL并将其粘贴到终端进行下载。如果遇到问题,可以尝试更换HTTP链接或等待一段时间重试。
202 2
|
2月前
|
Shell 定位技术 开发工具
[oeasy]python0015_键盘改造_将esc和capslock对调_hjkl_移动_双手正位
[oeasy] python0015_键盘改造_将 esc 和 capslock 对调_hjkl_移动_双手正位
29 3
|
2月前
|
Shell 开发工具 git
[oeasy]python019_ 如何在github仓库中进入目录_找到程序代码_找到代码
本文档介绍了如何在终端环境下使用Git克隆仓库后,通过`cd`、`pwd`和`ls`命令导航并找到下载的文件。首先,使用`ls`查看当前目录,然后通过`cd`逐层进入目标文件夹,最后到达包含游戏文件game.py的位置。文章还提到了如果`git clone`失败,可以直接进行下一节实验。
26 0

相关实验场景

更多