[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化

简介: [oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化

中文系统bgk 回忆上次内容

  • 汉字字形通过
  • 点阵式打字机
  • 像素级寻址的屏幕
  • 进入了计算机的世界


添加图片注释,不超过 140 字(可选)

  • 在海峡对岸的台湾同胞
  • 也进入了汉字时代


  • 他们会使用GB2312编码吗?
  • 能互通吗?🤔


中国台湾

  • BIG5 码
  • 是由 5 个公司联合制作的


  • 收录次序 取决于 频率
  • 然后是 笔画数
  • 然后是 康熙字典


  • 同时用 BIG5 编码和解码也是没有问题的
  • 但如果用BIG5编码
  • 却用gb2312解码就会有问题


添加图片注释,不超过 140 字(可选)

  • 不过存储的内容在文件里
  • 系统不知道用什么解码时
  • 默认自动会用 gb2312 解码
  • 这就造成了自动乱码


反之亦然

  • 我们用 gb2312 编码的文字
  • 用 gb2312 可以打开
  • 但是用 BIG5 打开就是乱码
  • 也需要转化


添加图片注释,不超过 140 字(可选)

  • 转化工具是有的
  • 能解决问题但很麻烦
  • 大量的输入输出编码解码的问题
  • 令人头大


添加图片注释,不超过 140 字(可选)

  • 确实麻烦

解决办法

  • 麻烦的地方正是机会所在

添加图片注释,不超过 140 字(可选)

  • 当时如果日文游戏或者台湾地区的游戏不能玩
  • 可能是因为字符编码格式不一致
  • 可以用南极星调整字符编码格式
  • 把不同编码格式进行转化
  • 把字节按照正确的方式进行解码
  • 就可以玩啦


  • 没有个标准整合一下吗?

GBK

  • GBK 即汉字内码扩展规范
  • 在GB2312的基础上扩展了繁体字符集
  • K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
  • 英文全称 Chinese Internal Code Specification
  • 最初是微软搞的
  • 虽然不是国家标准
  • 却是事实上的技术规范


添加图片注释,不超过 140 字(可选)

  • 共收入 21886 个汉字和图形符号
  • GB 2312 中的全部汉字、非汉字符号
  • BIG5 中的全部汉字(繁体兼容 GBK1)
  • 将 汉字、日本汉字、朝鲜汉字融合了
  • 合计 20902 个汉字


  • 标准并不是一蹴而就的

标准的烟花

  • 正如ASA X3.4-1963
  • 到 ASA X3.4-1965
  • 最终到ascii



添加图片注释,不超过 140 字(可选)

  • GB也在不断进化
  • 从GB/T 1355-86
  • 到GB/T 1355-2021
  • 这是小麦粉标准的进化




  • 从GB2312-1986
  • 再到GBK
  • 这是中文字符标准的进化



  • 但是还是有问题
  • GBK虽然兼容了BIG5 中的全部汉字
  • 但是无法兼容编码
  • 用GBK打开BIG5编码的文件还是乱码



问题

  • 如果新GBK兼容了BIG5编码
  • 就无法向前兼容gb2312


添加图片注释,不超过 140 字(可选)

  • 这无解了吗?
  • 时间自会给我们答案
  • 老天自有安排!


推荐一款 点阵字库

  • 中文点阵
  • 最小也需要 7x7 像素


添加图片注释,不超过 140 字(可选)

  • 这个风格很独特

字体辨识度

  • 字体辨识度

添加图片注释,不超过 140 字(可选)

字体样式

  • 1994年的《魔兽争霸》
  • 像素字体在RGB显卡的支持下
  • 字体不但可以有衬线
  • 而且可以有立体感




添加图片注释,不超过 140 字(可选)

  • 配色也很细腻

中文隶书

  • 智冠公司出品的《三国演义》

添加图片注释,不超过 140 字(可选)

  • 使用隶书和车马符号
  • 代表那个三国时代


终端时代的中文超文本编辑器

添加图片注释,不超过 140 字(可选)

  • 当时的wps系统

wps

  • 当时还没有所见即所得

添加图片注释,不超过 140 字(可选)

  • 使用一些编辑标记
  • 制作富文本


添加图片注释,不超过 140 字(可选)

  • 只有打印预览才能查看效果

中文之星

添加图片注释,不超过 140 字(可选)

  • 还可以做艺术字特效

总结

  • 中国的简体和繁体汉字
  • 字符数量都超级大
  • 彼此还认对方为乱码


  • 如果有一种编码 将所有的字符都能编进去就好了
  • 中日韩(CJK)
  • 简体繁体
  • 欧洲各种拼音
  • 梵文
  • 阿拉伯文
  • 等等等都包括进去


添加图片注释,不超过 140 字(可选)


目录
相关文章
|
9天前
|
机器学习/深度学习 数据采集 供应链
使用Python实现智能食品安全追溯系统的深度学习模型
使用Python实现智能食品安全追溯系统的深度学习模型
31 4
|
2月前
|
机器学习/深度学习 传感器 存储
使用 Python 实现智能地震预警系统
使用 Python 实现智能地震预警系统
122 61
|
24天前
|
弹性计算 数据管理 数据库
从零开始构建员工管理系统:Python与SQLite3的完美结合
本文介绍如何使用Python和Tkinter构建一个图形界面的员工管理系统(EMS)。系统包括数据库设计、核心功能实现和图形用户界面创建。主要功能有查询、添加、删除员工信息及统计员工数量。通过本文,你将学会如何结合SQLite数据库进行数据管理,并使用Tkinter创建友好的用户界面。
从零开始构建员工管理系统:Python与SQLite3的完美结合
|
16天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
63 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
16天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
62 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
19天前
|
人工智能 Shell 开发工具
[oeasy]python0041_输出ASCII码表_英文字符编码_键盘字符_ISO_646
本文介绍了ASCII码表的生成与使用,包括英文字符、数字和符号的编码。通过Python代码遍历0到127的ASCII值,解决了找不到竖线符号的问题,并解释了ASCII码的固定映射关系及其重要性。文章还介绍了ASCII码的历史背景,以及它如何成为国际标准ISO 646。最后,通过安装`ascii`程序展示了完整的ASCII码表。
13 1
|
28天前
|
机器学习/深度学习 数据采集 存储
使用Python实现智能农业灌溉系统的深度学习模型
使用Python实现智能农业灌溉系统的深度学习模型
132 6
|
1月前
|
人工智能 Python
[oeasy]python039_for循环_循环遍历_循环变量
本文回顾了上一次的内容,介绍了小写和大写字母的序号范围,并通过 `range` 函数生成了 `for` 循环。重点讲解了 `range(start, stop)` 的使用方法,解释了为什么不会输出 `stop` 值,并通过示例展示了如何遍历小写和大写字母的序号。最后总结了 `range` 函数的结构和 `for` 循环的使用技巧。
31 4
|
1月前
|
机器学习/深度学习 数据采集 算法框架/工具
使用Python实现智能生态系统监测与保护的深度学习模型
使用Python实现智能生态系统监测与保护的深度学习模型
87 4
|
2月前
|
存储 Python
[oeasy]python038_ range函数_大小写字母的起止范围_start_stop
本文介绍了Python中`range`函数的使用方法及其在生成大小写字母序号范围时的应用。通过示例展示了如何利用`range`和`for`循环输出指定范围内的数字,重点讲解了小写和大写字母对应的ASCII码值范围,并解释了`range`函数的参数(start, stop)以及为何不包括stop值的原因。最后,文章留下了关于为何`range`不包含stop值的问题,留待下一次讨论。
25 1