中文系统bgk 回忆上次内容
- 汉字字形通过
- 点阵式打字机
- 像素级寻址的屏幕
- 进入了计算机的世界
添加图片注释,不超过 140 字(可选)
- 在海峡对岸的台湾同胞
- 也进入了汉字时代
- 他们会使用GB2312编码吗?
- 能互通吗?🤔
中国台湾
- BIG5 码
- 是由 5 个公司联合制作的
- 收录次序 取决于 频率
- 然后是 笔画数
- 然后是 康熙字典
- 同时用 BIG5 编码和解码也是没有问题的
- 但如果用BIG5编码
- 却用gb2312解码就会有问题
添加图片注释,不超过 140 字(可选)
- 不过存储的内容在文件里
- 系统不知道用什么解码时
- 默认自动会用 gb2312 解码
- 这就造成了自动乱码
反之亦然
- 我们用 gb2312 编码的文字
- 用 gb2312 可以打开
- 但是用 BIG5 打开就是乱码
- 也需要转化
添加图片注释,不超过 140 字(可选)
- 转化工具是有的
- 能解决问题但很麻烦
- 大量的输入输出编码解码的问题
- 令人头大
添加图片注释,不超过 140 字(可选)
- 确实麻烦
解决办法
- 麻烦的地方正是机会所在
添加图片注释,不超过 140 字(可选)
- 当时如果日文游戏或者台湾地区的游戏不能玩
- 可能是因为字符编码格式不一致
- 可以用南极星调整字符编码格式
- 把不同编码格式进行转化
- 把字节按照正确的方式进行解码
- 就可以玩啦
- 没有个标准整合一下吗?
GBK
- GBK 即汉字内码扩展规范
- 在GB2312的基础上扩展了繁体字符集
- K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
- 英文全称 Chinese Internal Code Specification
- 最初是微软搞的
- 虽然不是国家标准
- 却是事实上的技术规范
添加图片注释,不超过 140 字(可选)
- 共收入 21886 个汉字和图形符号
- GB 2312 中的全部汉字、非汉字符号
- BIG5 中的全部汉字(繁体兼容 GBK1)
- 将 汉字、日本汉字、朝鲜汉字融合了
- 合计 20902 个汉字
- 标准并不是一蹴而就的
标准的烟花
- 正如ASA X3.4-1963
- 到 ASA X3.4-1965
- 最终到ascii
添加图片注释,不超过 140 字(可选)
- GB也在不断进化
- 从GB/T 1355-86
- 到GB/T 1355-2021
- 这是小麦粉标准的进化
- 从GB2312-1986
- 再到GBK
- 这是中文字符标准的进化
- 但是还是有问题
- GBK虽然兼容了BIG5 中的全部汉字
- 但是无法兼容编码
- 用GBK打开BIG5编码的文件还是乱码
问题
- 如果新GBK兼容了BIG5编码
- 就无法向前兼容gb2312
添加图片注释,不超过 140 字(可选)
- 这无解了吗?
- 时间自会给我们答案
- 老天自有安排!
推荐一款 点阵字库
- 中文点阵
- 最小也需要 7x7 像素
添加图片注释,不超过 140 字(可选)
- 这个风格很独特
字体辨识度
- 字体辨识度
添加图片注释,不超过 140 字(可选)
字体样式
- 1994年的《魔兽争霸》
- 像素字体在RGB显卡的支持下
- 字体不但可以有衬线
- 而且可以有立体感
添加图片注释,不超过 140 字(可选)
- 配色也很细腻
中文隶书
- 智冠公司出品的《三国演义》
添加图片注释,不超过 140 字(可选)
- 使用隶书和车马符号
- 代表那个三国时代
终端时代的中文超文本编辑器
添加图片注释,不超过 140 字(可选)
- 当时的wps系统
wps
- 当时还没有所见即所得
添加图片注释,不超过 140 字(可选)
- 使用一些编辑标记
- 制作富文本
添加图片注释,不超过 140 字(可选)
- 只有打印预览才能查看效果
中文之星
添加图片注释,不超过 140 字(可选)
- 还可以做艺术字特效
总结
- 中国的简体和繁体汉字
- 字符数量都超级大
- 彼此还认对方为乱码
- 如果有一种编码 将所有的字符都能编进去就好了
- 中日韩(CJK)
- 简体繁体
- 欧洲各种拼音
- 梵文
- 阿拉伯文
- 等等等都包括进去
添加图片注释,不超过 140 字(可选)
- 能有么?🤔
- 我们下次再说!👋
- 蓝桥->https://www.lanqiao.cn/courses/3584
- github->https://github.com/overmind1980/oeasy-python-tutorial
- gitee->https://gitee.com/overmind1980/oeasypython