[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

简介: [oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

日文假名和韩国谚文 回忆上次内容

  • 上次回顾了非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 世界各地编码分布
  • 拉丁字符扩展 ascii 共 16 种
  • 由iso组织制定
  • 从iso-8859-1
  • 到iso-8859-16


  • 无法同时显示俄文和法文



  • 此时中日韩的文字也需要进入计算机
  • 象形文字的字符集超级巨大
  • 日本、韩国也用汉字
  • 数量2万起步


添加图片注释,不超过 140 字(可选)

  • 真能把 如此巨大的字符集
  • 编码进入计算机吗?🤔


文字

  • 日本汉字我们可以直接看懂

添加图片注释,不超过 140 字(可选)

  • 地铁里的 标记

添加图片注释,不超过 140 字(可选)

  • 日文中 为什么
  • 这么多汉字呢?


遣唐使

  • 皇子公卿僧侣
  • 都要 专门
  • 来中国 朝圣
  • 学文化


添加图片注释,不超过 140 字(可选)

  • 日文 很多词
  • 都 能看懂
  • 管 老师 叫做 先生
  • 管 火车 叫做 机车
  • 管 学习 叫做 勉强
  • 管 辣 叫 辛


添加图片注释,不超过 140 字(可选)

  • 特别辣
  • 叫 激辛


  • 这些汉字怎么来的呢?

空海和尚

  • 从日本来的 留学僧
  • 不但学习 汉语佛法
  • 也学习 汉字书法


添加图片注释,不超过 140 字(可选)

  • 并把这些文化带回日本
  • 汉字 成为 书写符号
  • 口头系统的 日语
  • 可以 记录下来了



  • 正如同
  • 使用圣书体的一些字型
  • 将腓尼基的口语记录下来



万叶集

  • “叶” 是 “世”
  • 即时代
  • 希望能流传到万世


  • 各种各样的歌
  • 敬畏自然山神、河神 的歌
  • 男女恋爱 的歌
  • 挽歌


添加图片注释,不超过 140 字(可选)

  • 汉字
  • 数量很多
  • 记起来、写起来也比较复杂
  • 只有 最有文化的人
  • 才能 都写下来



  • 自己 写东西 的时候
  • 有些字 忘了 怎么写
  • 就拿一个 同音字
  • 来 假借



日语假名

  • 假借的 次数 多了
  • 就 固定了下来


  • 形成了
  • 专门的 日语拼音 字符


添加图片注释,不超过 140 字(可选)

  • 假名
  • 存在着多个体系
  • 不同的时代
  • 不同的地域



平假名

  • 直到明治33年
  • 发行公文才得以统一


  • 万葉仮名(假名)
  • 草书风格的符号
  • 有女性的柔美
  • 抄文众多
  • 《枕草子》
  • 《源氏物语》



添加图片注释,不超过 140 字(可选)

  • 把写法也固定了下来
  • 成为铅字


  • 万葉仮名(假名)
  • 形成了
  • 现代假名系统 中的 平假名



  • 除了平假名之外
  • 还有片假名


片假名

  • 片假名来自 汉字 的 一片
  • 也是一种 假名系统
  • 有 硬朗的 楷书 转化而来


添加图片注释,不超过 140 字(可选)

  • 明治维新时期
  • 大量欧美外来语涌入日本
  • 日语只取其读音
  • 用片假名将其表示出来


  • 假名系统
  • 是 拼音文字 系统
  • 字符数量 不多


最初的日文编码

  • 在ascii的基础上
  • 把片假名加了上去


添加图片注释,不超过 140 字(可选)

  • 字型什么样呢?

假名字形码

添加图片注释,不超过 140 字(可选)

  • 可以把这些片假名输出出来吗?

输出假名

  • 下面的代码是将a1到e0
  • 封包进入一个字节
  • 然后再将字节解码



添加图片注释,不超过 140 字(可选)

  • 可以动手试试
  • 以后我们会详细讲解封包解包


  • 范围[0xa1, 0xe0)

添加图片注释,不超过 140 字(可选)

勇者斗恶龙

  • 当时的日文
  • 能显示出ascii和假名的字型
  • 就已经很厉害


添加图片注释,不超过 140 字(可选)

  • 想显示出中文字型
  • 是不可能的


日本汉字

  • 是中文的拼音文字
  • 只是假名都加在一起就至少 100+
  • 128 根本不够用


添加图片注释,不超过 140 字(可选)

  • 更何况日文里面用日本汉字
  • 虽然只有2000个不到
  • 但是是文化的象征


  • 不过假名毕竟是假的
  • 日文中最厉害的还是汉字


汉字文化

  • 日语中混有各种汉字

添加图片注释,不超过 140 字(可选)

  • 感觉根本不用翻译

添加图片注释,不超过 140 字(可选)

  • 也会造一些日本汉字

汉字

发音

含义

なぎ

风平 浪静

しずく

水滴 如雨下

しつけ

教育

さかき

寺庙里的 树

评选年度汉字

添加图片注释,不超过 140 字(可选)

  • 所以日文中的字符直接超过2000+
  • 1 个字节 是不够了
  • 至少需要 2 个字节


添加图片注释,不超过 140 字(可选)

  • 日本规格协会制定标准
  • JIS X 0212


  • 点阵字库 产生了
  • 日本汉字的黑体模式


无衬线黑体风格

  • 无衬线
  • 黑体
  • 注重实效
  • 注重清晰度



添加图片注释,不超过 140 字(可选)

  • 任何字帖一般都有两种风格
  • 板正规范的生硬风格
  • 圆润灵动的手写风格


手写风格

添加图片注释,不超过 140 字(可选)

  • 不像大写字母
  • 那么生硬


添加图片注释,不超过 140 字(可选)

  • 就像小写字母
  • 那么圆滑


  • 韩文字符又是如何编码的呢?

韩文

  • 韩文也是一种拼音文字
  • 基础字母有二十四个
  • 符号是朝鲜王朝世宗大王时创作的
  • 从此韩文有了谚文



添加图片注释,不超过 140 字(可选)

  • 但是韩国士大夫会写汉字
  • 不愿意推广谚文


拼音

  • 不过拼音文字
  • 更容易一些


添加图片注释,不超过 140 字(可选)

  • 谚文书写 普及速度 比汉字书写 快得多
  • 拼音 是有结构的

谚文结构

  • 谚文是由表音符号组合而成的
  • 有各种间架结构


添加图片注释,不超过 140 字(可选)

  • 这些声旁都发什么音呢?

声音

  • 韩文名字
  • 宋仲基(송중기)
  • 金喜善(김희선)
  • 李英爱(이영애)
  • 阿一古(아이구)
  • 圆圈不发音


添加图片注释,不超过 140 字(可选)

  • 从此就连哎呦喂(阿一古)
  • 都有了标准发音方法
  • 用拼音文字把读音固化下来


  • 谚文有多少字符呢?

谚文字符

  • 声母韵母拼写在一起算一个
  • 共 554 个


  • 而且这还不算朝鲜汉字

添加图片注释,不超过 140 字(可选)

  • 这554个基础字符导致
  • 1 个字节不够
  • 2 个字节才够


  • 韩文的字符集为
  • KS X 1001


总结

  • 日韩各有 编码格式
  • 日本
  • 有假名
  • 五十音
  • 一字节 可以勉强放下


  • 有日本汉字
  • 字符数量超过20000+



  • 韩国
  • 有谚文
  • 数量超过500
  • 一个字节 放不下


  • 有朝鲜汉字
  • 字符数量超过20000+




添加图片注释,不超过 140 字(可选)

  • 作为 汉字源头的中国
  • 究竟应该 如何对汉字 进行编码 呢?🤔



目录
相关文章
|
9月前
|
人工智能 Python
[oeasy]python082_变量部分总结_variable_summary
本文介绍了变量的定义、声明、赋值及删除操作,以及Python中的命名规则和常见数据类型。通过示例讲解了字符串与整型的基本用法、类型转换方法和加法运算的区别。此外,还涉及异常处理(try-except)、模块导入(如math和random)及随机数生成等内容。最后总结了实验要点,包括捕获异常、进制转化、变量类型及其相互转换,并简述了编程中AI辅助的应用策略,强调明确目标、分步实施和逐步巩固的重要性。更多资源可在蓝桥、GitHub和Gitee获取。
304 97
|
9月前
|
人工智能 Python
[oeasy]python089_列表_删除列表项_remove_列表长度_len
本文介绍了Python列表(list)的操作方法,重点讲解了`remove`方法的使用。通过实例演示如何删除列表中的元素,探讨了`ValueError`异常产生的原因,并分析了时间复杂度O(n)的概念。同时提及了`clear`方法清空列表的功能及`len`函数获取列表长度的用法。最后以购物清单为例,展示列表的实际应用场景,并预告快速生成列表的方法将在后续内容中介绍。
304 62
|
8月前
|
存储 索引 Python
[oeasy]python093_find方法_指数为负数_index_实际效果
本文介绍了Python中`find`方法与索引(index)的使用,包括负数索引的实际效果。回顾了`eval`函数的应用,并强调类名如`str`、`int`、`list`不可用作变量名以避免覆盖。通过示例解析了负数索引在字符串和列表中的作用,以及`index`方法的三个参数(value、start、stop)的用法。同时对比了`index`和`find`方法的区别:`index`找不到子串时抛出`ValueError`,而`find`返回-1。最后总结了正负索引的使用场景及两者的特性,提供了相关学习资源链接。
472 8
|
9月前
|
人工智能 索引 Python
[oeasy]python091_列表_索引_index_中括号_索引函数
本文介绍了Python中列表与字符串的索引及index函数用法。通过range生成列表,使用索引[]访问和修改列表元素,index函数查找元素位置。字符串支持索引访问但不可直接修改。还探讨了16进制数在Python中的表示方法,以及日期、月份等特殊字符的Unicode范围。最后总结了列表与字符串操作的区别,并预告后续内容,提供蓝桥云课、GitHub和Gitee链接供进一步学习。
260 20
|
10月前
|
人工智能 Java 数据安全/隐私保护
[oeasy]python081_ai编程最佳实践_ai辅助编程_提出要求_解决问题
本文介绍了如何利用AI辅助编程解决实际问题,以猫屎咖啡的购买为例,逐步实现将购买斤数换算成人民币金额的功能。文章强调了与AI协作时的三个要点:1) 去除无关信息,聚焦目标;2) 将复杂任务拆解为小步骤,逐步完成;3) 巩固已有成果后再推进。最终代码实现了输入验证、单位转换和价格计算,并保留两位小数。总结指出,在AI时代,人类负责明确目标、拆分任务和确认结果,AI则负责生成代码、解释含义和提供优化建议,编程不会被取代,而是会更广泛地融入各领域。
327 29
|
9月前
|
Python
[oeasy]python086方法_method_函数_function_区别
本文详细解析了Python中方法(method)与函数(function)的区别。通过回顾列表操作如`append`,以及随机模块的使用,介绍了方法作为类的成员需要通过实例调用的特点。对比内建函数如`print`和`input`,它们无需对象即可直接调用。总结指出方法需基于对象调用且包含`self`参数,而函数独立存在无需`self`。最后提供了学习资源链接,方便进一步探索。
250 17
|
9月前
|
Python 容器
[oeasy]python090_列表_构造_范围_range_start_end_step_步长
本文介绍了Python中列表的生成方法,重点讲解了`range()`函数的使用。通过`range(start, stop, step)`可生成一系列整数,支持正负步长,但不支持小数参数。文章从基础的列表追加、直接赋值到复杂的应用场景(如生成等宽字体的月份列表),结合实例演示了`range()`的灵活性与实用性。最后总结了`range()`的关键特性:前闭后开、支持负数步长,并提供了进一步学习的资源链接。
310 12
|
9月前
|
索引 Python
[oeasy]python092_eval_衡量_转化为列表
本文探讨了 Python 中 `eval` 函数的用法及其与字符串和列表之间的转换关系。通过实例分析,展示了如何使用 `eval` 将字符串转化为对应的数据类型,例如将表示列表的字符串转回列表。同时,文章深入讲解了 `eval` 的工作机制,包括根据本地和全局变量对字符串进行计算的能力。此外,还提醒了命名变量时需避免覆盖内置类名(如 `str`、`int`、`list`)的重要性,以免影响程序正常运行。最后,简要提及字符串和列表索引中负数的应用,并为读者提供了进一步学习的资源链接。
225 2
|
9月前
|
人工智能 Python
[oeasy]python088_列表_清空列表_clear
本文介绍了Python中列表的清空方法`clear`。通过实例讲解了`clear`与将列表赋值为空列表的区别,前者会清空原列表内容,而后者创建新空列表,不影响原列表。文中以收银程序为例,展示了`clear`的实际应用场景,并通过地址观察解释了两者的机制差异。最后总结了相关术语如`list`、`append`、`clear`等,帮助理解列表操作及方法调用的概念。
246 5
|
9月前
|
人工智能 Python
[oeasy]python083_类_对象_成员方法_method_函数_function_isinstance
本文介绍了Python中类、对象、成员方法及函数的概念。通过超市商品分类的例子,形象地解释了“类型”的概念,如整型(int)和字符串(str)是两种不同的数据类型。整型对象支持数字求和,字符串对象支持拼接。使用`isinstance`函数可以判断对象是否属于特定类型,例如判断变量是否为整型。此外,还探讨了面向对象编程(OOP)与面向过程编程的区别,并简要介绍了`type`和`help`函数的用法。最后总结指出,不同类型的对象有不同的运算和方法,如字符串有`find`和`index`方法,而整型没有。更多内容可参考文末提供的蓝桥、GitHub和Gitee链接。
242 11

推荐镜像

更多