[oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

简介: [oeasy]python0 113_字符编码_VT100控制码_iso_8859_1_拉丁字符_latin

拉丁字符 回忆上次内容

  • 上次回顾了字型编码的进化过程
  • 7-bit 的 点阵字库
  • 终于让 字母、数字、标点 明确了字型



  • 但是 7-bit 的 ascii中
  • 没有法文字符的位置


添加图片注释,不超过 140 字(可选)

  • 如果扩展位为1
  • 不同的计算机厂商
  • 有各自不同的 扩展方式



  • 这噩梦
  • 比法语不兼容 更可怕!😱
  • 这以后 编码就越来越多了
  • 互认对方为乱码


  • 法文字符
  • 完全被 不同的字符集
  • 直接 变成乱码



  • 这可怎么办呢?🤔

那可是法国啊!

  • 法国毕竟 曾是 与英国全球争霸的对手

添加图片注释,不超过 140 字(可选)

  • 美国 从英国独立 最早靠的
  • 还是 富兰克林来法国
  • 找路易十五要的 军事和经济支持


  • 现在美国字符集ascii里面
  • 没有法文字符的位置?



  • 伤心的法国人 不由得回忆起那场海战

特拉法尔加海战

  • 如果当年法国拿破仑选用富尔顿的火轮船
  • 那特拉法尔加海战会被改写


  • 如果 结局改写
  • 美利坚 可能是 法国殖民地


添加图片注释,不超过 140 字(可选)

  • 英国应该 无法和法国 在海上争霸
  • 最终 世界语言是法语
  • 美国 入学考的不是TOEFL
  • 而是 TOFFL


添加图片注释,不超过 140 字(可选)

  • 再往前
  • 英国就更非主流了


征服者威廉

  • 法兰克王国 诺曼地区的公爵威廉
  • 跨过英吉利海峡
  • 成了 不列颠岛的征服者威廉



添加图片注释,不超过 140 字(可选)

  • 不列颠岛 北高南低
  • 挡住北边的冷风
  • 非常 适合生存
  • 从来就 不乏 征服者


英伦

  • 伊比利亚、凯尔特、罗马、昂撒、丹麦、法国诺曼都曾征服不列颠
  • 英格兰岛的名字 来自于 盎格鲁部落
  • 当时昂撒 是 凯尔特人 搬来的救兵
  • 假途灭虢 占了这个南方平坦的宝岛
  • 说 这是我们盎格鲁人的岛
  • England


  • 盎格鲁岛人说的语言
  • English



添加图片注释,不超过 140 字(可选)

  • 英国的文化 本就是 多民族、宗教杂糅出来的一个混合体
  • 从不希望 欧洲大陆出现强大的帝国
  • 那就会 威胁到岛上的安全


  • 英国对于 欧洲各国制衡之术
  • 又被后来的美国 学去制衡 整个欧亚大陆


  • 不过说到底 所有文化的开局 都是从非洲走出来的
  • 最最开始都是 从无机物 偶然变成 有机物


  • 但是 电子信息化到数字化 是一个新的大环境
  • 法文字符 的编码方式 会统一 吗?


  • 先回顾 ASCII的基本情况

ascii

  • 目前最熟悉的编码是 ascii编码
  • 包括控制字符、大小写字符、数字、符号


  • 字节中 第 1 位 为 0
  • 后 7 位
  • 0x00-0x7F


  • 这里面 没有法文字符


添加图片注释,不超过 140 字(可选)

  • 但如果第 1 位是 1
  • 又会如何呢?


尝试输出

  • 找到一个数字 0xa7
  • 找到 数字对应的字符
  • 这是个 章节符号


添加图片注释,不超过 140 字(可选)

  • 也可以形成
  • 一个闭环


闭环

  • 这规律
  • 和ascii 一样的
  • 也就是说 这个字节里面除了 ascii 的 128 个字符之外
  • 还可以 有一定的
  • 还可以 对应更多字符



添加图片注释,不超过 140 字(可选)

  • 等于是 把ascii编码 给扩展了

编码格式

  • 跨国跨语言的事情 怎么办?
  • 还是要 看用户数量


添加图片注释,不超过 140 字(可选)

  • Dec公司的 VT100
  • 质量 过硬
  • 价格 实惠
  • 终成 新一代机皇


机皇的影响力

  • 新的终端
  • 就必须兼容VT100
  • 包括VT100中 一项新功能


添加图片注释,不超过 140 字(可选)

  • 这CSI
  • 不就是 控制序列\e 吗?


事实上的标准

  • VT100 是当时 最流行的终端
  • 不但支持 常用的转义字符
  • 还创造出 VT100控制码


\033[0m        // 关闭所有属性 \033[1m        // 设置为高亮 \033[4m        // 下划线 \033[5m        // 闪烁 \033[7m        // 反显 \033[8m        // 消隐 \033[nA        // 光标上移 n 行 \033[nB        // 光标下移 n 行 \033[nC        // 光标右移 n 行 \033[nD        // 光标左移 n 行 \033[y;xH    // 设置光标位置 \033[2J        // 清屏

  • 这就是 后来CSI的雏形 😁
  • Control Sequence Introducer


  • 有了这个 就可以控制
  • 字体
  • 位置
  • 颜色


  • 慢慢 DEC的VT100标准
  • 就成了 计算机终端的标准


ISO组织

  • 总部在 瑞士日内瓦湖的 ISO组织
  • 负责 跨国跨公司的标准化
  • 在Dec所用 编码格式的基础 上
  • 发展出 iso-8859-1 字符集



  • 为什么 选择Dec的 编码格式?
  • 因为 VT100是 当时的 一代机皇
  • 用户数量 就是 事实上的标准


添加图片注释,不超过 140 字(可选)

  • 根据 dec公司的 字符集
  • 生成了 扩展ascii字符集(charset)


  • 前一半(0-127)
  • 没有动
  • 还是ascii


  • 后一半(128-255)
  • 换成了 西欧北欧各国拉丁字符


  • 这个 编码
  • 叫做 iso-8859-1
  • 也叫做 latin-1


  • latin-1覆盖的 范围如何呢?

覆盖范围

  • 西欧北欧语族都可以覆盖到
  • 拉丁人的罗曼语族(法意西葡)
  • 日耳曼人的日耳曼语族(瑞丹挪德冰)
  • 凯尔特人的盖尔语族(苏爱)


添加图片注释,不超过 140 字(可选)

latin-1

  • 拉丁语(法意西葡)我们好理解
  • 拉丁正宗


添加图片注释,不超过 140 字(可选)

  • 北欧 这么多国家
  • 为什么 都使用拉丁字符呢?


  • 北欧 不是有 自己的一套符文系统吗?

添加图片注释,不超过 140 字(可选)

  • 日耳曼语族 不是和 拉丁语族 并列的吗?

总结

  • 这次回顾了 非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 西欧、北欧语言 大多使用 拉丁字符
  • 由iso组织 制定iso-8859-1


添加图片注释,不超过 140 字(可选)


目录
相关文章
|
3月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
191 4
|
9月前
|
人工智能 Python
[oeasy]python082_变量部分总结_variable_summary
本文介绍了变量的定义、声明、赋值及删除操作,以及Python中的命名规则和常见数据类型。通过示例讲解了字符串与整型的基本用法、类型转换方法和加法运算的区别。此外,还涉及异常处理(try-except)、模块导入(如math和random)及随机数生成等内容。最后总结了实验要点,包括捕获异常、进制转化、变量类型及其相互转换,并简述了编程中AI辅助的应用策略,强调明确目标、分步实施和逐步巩固的重要性。更多资源可在蓝桥、GitHub和Gitee获取。
298 97
|
9月前
|
人工智能 Python
[oeasy]python089_列表_删除列表项_remove_列表长度_len
本文介绍了Python列表(list)的操作方法,重点讲解了`remove`方法的使用。通过实例演示如何删除列表中的元素,探讨了`ValueError`异常产生的原因,并分析了时间复杂度O(n)的概念。同时提及了`clear`方法清空列表的功能及`len`函数获取列表长度的用法。最后以购物清单为例,展示列表的实际应用场景,并预告快速生成列表的方法将在后续内容中介绍。
298 62
|
8月前
|
存储 索引 Python
[oeasy]python093_find方法_指数为负数_index_实际效果
本文介绍了Python中`find`方法与索引(index)的使用,包括负数索引的实际效果。回顾了`eval`函数的应用,并强调类名如`str`、`int`、`list`不可用作变量名以避免覆盖。通过示例解析了负数索引在字符串和列表中的作用,以及`index`方法的三个参数(value、start、stop)的用法。同时对比了`index`和`find`方法的区别:`index`找不到子串时抛出`ValueError`,而`find`返回-1。最后总结了正负索引的使用场景及两者的特性,提供了相关学习资源链接。
463 8
|
9月前
|
人工智能 索引 Python
[oeasy]python091_列表_索引_index_中括号_索引函数
本文介绍了Python中列表与字符串的索引及index函数用法。通过range生成列表,使用索引[]访问和修改列表元素,index函数查找元素位置。字符串支持索引访问但不可直接修改。还探讨了16进制数在Python中的表示方法,以及日期、月份等特殊字符的Unicode范围。最后总结了列表与字符串操作的区别,并预告后续内容,提供蓝桥云课、GitHub和Gitee链接供进一步学习。
255 20
|
10月前
|
人工智能 Java 数据安全/隐私保护
[oeasy]python081_ai编程最佳实践_ai辅助编程_提出要求_解决问题
本文介绍了如何利用AI辅助编程解决实际问题,以猫屎咖啡的购买为例,逐步实现将购买斤数换算成人民币金额的功能。文章强调了与AI协作时的三个要点:1) 去除无关信息,聚焦目标;2) 将复杂任务拆解为小步骤,逐步完成;3) 巩固已有成果后再推进。最终代码实现了输入验证、单位转换和价格计算,并保留两位小数。总结指出,在AI时代,人类负责明确目标、拆分任务和确认结果,AI则负责生成代码、解释含义和提供优化建议,编程不会被取代,而是会更广泛地融入各领域。
319 29
|
9月前
|
Python
[oeasy]python086方法_method_函数_function_区别
本文详细解析了Python中方法(method)与函数(function)的区别。通过回顾列表操作如`append`,以及随机模块的使用,介绍了方法作为类的成员需要通过实例调用的特点。对比内建函数如`print`和`input`,它们无需对象即可直接调用。总结指出方法需基于对象调用且包含`self`参数,而函数独立存在无需`self`。最后提供了学习资源链接,方便进一步探索。
237 17
|
9月前
|
Python 容器
[oeasy]python090_列表_构造_范围_range_start_end_step_步长
本文介绍了Python中列表的生成方法,重点讲解了`range()`函数的使用。通过`range(start, stop, step)`可生成一系列整数,支持正负步长,但不支持小数参数。文章从基础的列表追加、直接赋值到复杂的应用场景(如生成等宽字体的月份列表),结合实例演示了`range()`的灵活性与实用性。最后总结了`range()`的关键特性:前闭后开、支持负数步长,并提供了进一步学习的资源链接。
300 12
|
9月前
|
索引 Python
[oeasy]python092_eval_衡量_转化为列表
本文探讨了 Python 中 `eval` 函数的用法及其与字符串和列表之间的转换关系。通过实例分析,展示了如何使用 `eval` 将字符串转化为对应的数据类型,例如将表示列表的字符串转回列表。同时,文章深入讲解了 `eval` 的工作机制,包括根据本地和全局变量对字符串进行计算的能力。此外,还提醒了命名变量时需避免覆盖内置类名(如 `str`、`int`、`list`)的重要性,以免影响程序正常运行。最后,简要提及字符串和列表索引中负数的应用,并为读者提供了进一步学习的资源链接。
213 2
|
9月前
|
人工智能 Python
[oeasy]python088_列表_清空列表_clear
本文介绍了Python中列表的清空方法`clear`。通过实例讲解了`clear`与将列表赋值为空列表的区别,前者会清空原列表内容,而后者创建新空列表,不影响原列表。文中以收银程序为例,展示了`clear`的实际应用场景,并通过地址观察解释了两者的机制差异。最后总结了相关术语如`list`、`append`、`clear`等,帮助理解列表操作及方法调用的概念。
235 5

推荐镜像

更多