[oeasy]python0123_中文字符_文字编码_gb2312_激光照排技术_王选

简介: [oeasy]python0123_中文字符_文字编码_gb2312_激光照排技术_王选

中文编码GB2312 回忆上次内容

  • 上次回顾了 日韩各有 编码格式
  • 日本
  • 有假名
  • 五十音
  • 一字节 可以勉强放下


  • 有日本汉字
  • 字符数量超过20000+



  • 韩国
  • 有谚文
  • 数量超过500
  • 一个字节 放不下


  • 有朝鲜汉字
  • 字符数量超过20000+




添加图片注释,不超过 140 字(可选)

  • 作为 汉字源头的中国
  • 究竟应该 如何对汉字 进行编码 呢?🤔


汉字

  • 汉字起源于甲骨文
  • 是世界上唯一还在使用的象形文字
  • 真的很不容易


添加图片注释,不超过 140 字(可选)

  • 写的本意 就是 画
  • 写意
  • 写生


  • 这就是最初的
  • 象形字


六书

  • 以象形为基础
  • 指事
  • 会意
  • 形声
  • 转注
  • 假借


添加图片注释,不超过 140 字(可选)

  • 字的结构是什么呢?

间架结构

  • 上下
  • 左右
  • 内外

添加图片注释,不超过 140 字(可选)

  • 字型相当复杂
  • 笔画也千姿百态

汉字笔画

  • 笔画也比较复杂

添加图片注释,不超过 140 字(可选)

  • 运笔藏锋都很有讲究

中国大陆地区

  • 中国大陆地区最早使用 GB/T 2312-1980
  • 当时参考了比我们先进的日本JIS 字符集
  • 1980 年 指定的国标 (GuoBiao)
  • 1981 年 5 月 1 日开始使用


添加图片注释,不超过 140 字(可选)

  • GB2312 编码共收录汉字 6763 个
  • 其中一级汉字 3755 个
  • 二级汉字 3008 个


  • 这么多字怎么排呢?

区位

  • 01-09 区为特殊符号
  • 先把ascii的128个字符让出去
  • 然后在留有一些制表的字符
  • 还留了相当多的空余


  • 16-55 区为一级汉字
  • 按拼音排序


  • 56-87 区为二级汉字
  • 按部首/笔画排序


添加图片注释,不超过 140 字(可选)

  • 出了汉字之外,还收录了
  • 拉丁字母
  • 希腊字母
  • 日文平假名及片假名字母
  • 俄语西里尔字母
  • 真的很全了


  • 可是这gb2312
  • 具体是如何编解码的呢?🤔


应用

添加图片注释,不超过 140 字(可选)

  • 如果是0-127以内的ascii字符
  • 标志位为0
  • 1个字节存储


添加图片注释,不超过 140 字(可选)

  • 如果是ascii以外的字符
  • 标志位为1
  • 2个字节存储


编解码

  • 编解码方法一致就可以
  • 解铃还须系铃人


添加图片注释,不超过 140 字(可选)

  • 同时用 gb2312 编解码是没有问题的
  • 这篇 制定标准的文档
  • 当时怎么打印出来的呢?
  • 制定内码标准的 时候 就有 字形 了吗?


铅字

  • 虽然 计算机 在当时 还 没有普及
  • 但是 出版行业 已经 工业化 了


添加图片注释,不超过 140 字(可选)

  • 印刷厂 使用 铅活字 进行排版
  • 铸字工
  • 拼版工
  • 还有拣字工


拣字工

  • 印刷家谱 从 一个大盒子 就够了

添加图片注释,不超过 140 字(可选)

  • 字 再多些
  • 要用 转轮排字盘


添加图片注释,不超过 140 字(可选)

  • 字 再多些呢?

捡字室

  • 大 印刷厂
  • 字模 特别多


添加图片注释,不超过 140 字(可选)

  • 甚至 要放
  • 好 几面墙
  • 好 几张桌子


开端

  • 这 也 曾被
  • 使用26个字母的 西方文明 嘲讽


添加图片注释,不超过 140 字(可选)

  • 出书确实不易
  • 捡好了 字
  • 排好了 版
  • 先 打个样
  • 再来 校对
  • 再 浇铅板
  • 最后 印刷


  • 最初的
  • 书籍
  • 杂志
  • 报纸
  • 试卷
  • 都是这样    印刷出来 的


  • 到了 印刷 gb2312-80标准的 1980年
  • 已经启用了新的技术


机械打字机

  • 从 轮转排字盘
  • 到 谢卫楼 发明的 中文打字机


添加图片注释,不超过 140 字(可选)

  • 再到 舒震东
  • 在前人的研究基础上经过创新
  • 得到的 舒式打字机


添加图片注释,不超过 140 字(可选)

  • 中文字符 的数量
  • 是 一个难关


  • 直到
  • 照相技术 的 发展


照片排版

  • 使用 照片底片 进行排版

添加图片注释,不超过 140 字(可选)

  • 也面临检字的工作

添加图片注释,不超过 140 字(可选)

  • 照片排版技术本身也在迭代

激光照排

  • 这次使用 激光 扫描照片

添加图片注释,不超过 140 字(可选)

  • 每一个小字型都是一个照片
  • 根据汉字内码找到汉字对应的激光照片
  • 然后再把激光照片像活字一样排版
  • 这就是激光照排技术


添加图片注释,不超过 140 字(可选)

  • 用照片排版的方式
  • 制作了这样一个汉字编码的文档


  • 标准定了立刻就能用起来么?

过程

  • 凡事都有个过程
  • 95年定的gbk
  • 98年才逐渐推行开来


  • 但还是有些生僻字没有相应的字型

添加图片注释,不超过 140 字(可选)

  • 内码从无到有
  • 字形码也从无到有


添加图片注释,不超过 140 字(可选)

感谢前辈

  • 感谢王选与陈堃銶前辈的技艺

添加图片注释,不超过 140 字(可选)

  • 激光照排技术 可以
  • 印刷中文书籍 和 报纸 了


总结

  • 简体和繁体的汉字
  • 字符数量都超级大
  • 感谢王选和陈堃銶等前辈发明了激光照排技术
  • 中文排版从此使用上了gb2312编码


添加图片注释,不超过 140 字(可选)

  • 纸张之外
  • 显示器是更先进的输出设备



目录
相关文章
|
1月前
|
API Python
【02】优雅草央央逆向技术篇之逆向接口协议篇-以小红书为例-python逆向小红书将用户名转换获得为uid-优雅草央千澈
【02】优雅草央央逆向技术篇之逆向接口协议篇-以小红书为例-python逆向小红书将用户名转换获得为uid-优雅草央千澈
94 1
|
26天前
|
人工智能 Shell 开发工具
[oeasy]python062_在python中完成输入和输出_input_print
本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
115 66
|
3天前
|
JavaScript 搜索推荐 Android开发
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
22 8
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
|
3天前
|
数据采集 JavaScript Android开发
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
25 7
【02】仿站技术之python技术,看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
|
5天前
|
人工智能 Shell 开发工具
[oeasy]python065python报错怎么办_try_试着来_except_发现异常
本文介绍了Python中处理异常的基本方法,重点讲解了`try`和`except`的用法。通过一个计算苹果重量的小程序示例,展示了如何捕获用户输入错误并进行处理。主要内容包括: 1. **回顾上次内容**:简要回顾了Shell环境、Python3游乐场和Vim编辑器的使用。 2. **编写程序**:编写了一个简单的程序来计算苹果的总重量,但发现由于输入类型问题导致结果错误。 3. **调试与修正**:通过调试发现输入函数返回的是字符串类型,需要将其转换为整数类型才能正确计算。
48 32
|
3天前
|
数据库 Python
[oeasy]python066_如何捕获多个异常_try_否则_else_exception
本文介绍了Python中`try...except...else`结构的使用方法。主要内容包括: 1. **回顾上次内容**:简要复习了`try`和`except`的基本用法,强调了异常处理的重要性。 2. **详细解释**: - `try`块用于尝试执行代码,一旦发现错误会立即终止并跳转到`except`块。 - `except`块用于捕获特定类型的异常,并进行相应的处理。 - `else`块在没有异常时执行,是可选的。 3. **示例代码**:通过具体例子展示了如何捕获不同类型的异常(如`ValueError`和`ZeroDivisionError`),并解释了异常处理
33 24
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
126 80
|
9天前
|
缓存 Shell 开发工具
[oeasy]python064_命令行工作流的总结_vim_shell_python
本文总结了命令行工作流中的关键工具和操作,包括vim、shell和Python。主要内容如下: 1. **上次回顾**:完成了输入输出的代码编写,并再次练习了vim的使用。 2. **shell基础**:介绍了shell环境及其基本命令,如`pwd`、`cd`、`ll -l`等。 3. **Python游乐场**:通过`python3`命令进入Python交互环境,可以进行简单计算和函数调用,常用函数有`help`、`ord`、`chr`等。 4. **vim编辑器**:详细讲解了vim的三种模式(正常模式、插入模式、底行命令模式)及其切换方法,以及常用的底行命令如`:w`、`:q`、`
45 15
|
22天前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
58 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
1月前
|
人工智能 Unix Java
[oeasy]python059变量命名有什么规则_惯用法_蛇形命名法_name_convention_snake
本文探讨了Python中变量命名的几种常见方式,包括汉语拼音变量名、蛇形命名法(snake_case)和驼峰命名法(CamelCase)。回顾上次内容,我们主要讨论了使用下划线替代空格以提高代码可读性。实际编程中,当变量名由多个单词组成时,合理的命名惯例变得尤为重要。
85 9

热门文章

最新文章