[oeasy]python0133_[趣味拓展]好玩的unicode字符_另类字符_上下颠倒英文字符

简介: [oeasy]python0133_[趣味拓展]好玩的unicode字符_另类字符_上下颠倒英文字符

另类字符 回忆上次内容

  • 上次再次输出了大红心<span style="font-size:64px;color:red">♥</span>
  • 找到了红心对应的编码
  • 黑红梅方都对应有编码


  • 原来的编码叫做 ascii️
  • \u这种新的编码方式叫unicode
  • 包括了 中日韩字符集等 各书写系统的字符集


  • 除了这些常规字符之外
  • 还有什么好玩的东西呢?


颠倒字符

添加图片注释,不超过 140 字(可选)

尝试

添加图片注释,不超过 140 字(可选)

  • 序号还是比较靠前的
  • 应该是一些拉丁字符
  • 类似的还有带圈圈的英文字符

带圈字符

添加图片注释,不超过 140 字(可选)

  • 带上圈圈之后
  • 给人一种ꫛꫀꪝ的感觉


  • 这些都是谁规定的呢?

继续探索

  • unicode 其实有个委员会
  • 各种大厂都在里面指定标准
  • 我们也可以访问 unicode.org
  • 具体的编码字符都可以在里面找

添加图片注释,不超过 140 字(可选)

炼金术师的符号

添加图片注释,不超过 140 字(可选)

古代字符编码



添加图片注释,不超过 140 字(可选)

  • 回忆起拉丁字符走过的路

拉丁字符之路

添加图片注释,不超过 140 字(可选)

时间相关

  • 这个编码可以解决等宽的问题
  • 而且还有汉字
  • 目前大多数字体支持
  • ㋀㋁㋂㋃㋄㋅㋆㋇㋈㋉㋊㋋
  • ㏠㏡㏢㏣㏤㏥㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹㏺㏻㏼㏽㏾
  • ㍘㍙㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭㍮㍯㍰


货币相关

添加图片注释,不超过 140 字(可选)

音乐相关

添加图片注释,不超过 140 字(可选)

中文字符

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

  • 这些编码实在是偏门

亚文化

  • 不过很有趣
  • 目前大多数字库文件还不支持

添加图片注释,不超过 140 字(可选)

  • 不知道这些参与 unicode 编码规则制定的大公司在想些什么?

扑克编码

添加图片注释,不超过 140 字(可选)

  • 我们以前介绍过黑红梅方的编码
  • 配合数字可以做出扑克效果
  • 这个编码直接就是牌
  • C 是骑士牌(knight card)
  • 我们一般都是 54 张牌
  • 目前大多数字符库还不支持 unicode 这个编码段的部分
  • 支持了之后就可以直接字符打牌了

国际象棋

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

  • 目前大多数字体不支持

麻将

  • 中式麻将牌在这里
  • 红红火火
  • 梅兰竹菊 春夏秋冬 就连百搭都有


  • 以后用户名也许可以用麻将字符了
  • 🀀🀁🀂🀃🀆🀅🀄
  • 🀇🀈🀉🀊🀋🀌🀍🀎🀏
  • 🀐🀑🀒🀓🀔🀕🀖🀗🀘
  • 🀙🀚🀛🀜🀝🀞🀟🀠🀡
  • 九筒



  • 不过目前多数字库还不支持

添加图片注释,不超过 140 字(可选)

各种符号

添加图片注释,不超过 140 字(可选)

  • 符号还在不断添加中

新的符号

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

  • 各种杂项费用还是很多的甚至包含 emoji
  • 这些新增的字符除了好玩之外
  • 也会对于我们产生影响
  • 其实我们也有这种符号

五岳真形图

添加图片注释,不超过 140 字(可选)

  • 也许有一天unicode中会出现五岳的符号
  • 还有一些同型不同序号的字

易混淆文字

添加图片注释,不超过 140 字(可选)

  • 这两个文字非常相像但却是两个不同的字符
  • 第1个是常用的
  • 第2个是1999年更新中新加进去的康熙部首


添加图片注释,不超过 140 字(可选)

  • 这种长相类似的字符有什么用么?

阴阳话题

  • 作为计算机理解这就是两个词条

添加图片注释,不超过 140 字(可选)

  • 这是公关降热度的一个手法

部首

  • 还有什么类似的字符吗?

添加图片注释,不超过 140 字(可选)

  • 康熙部首
  • 2F00-2FD5


  • 扩展部首
  • 2E80-2EF3


  • 如果当前系统不认识这个字符
  • 怎么办呢?

不识别

  • 但是如果发送过来的字符
  • 在当前的系统中没有对应的字符
  • 应该怎么办呢?

添加图片注释,不超过 140 字(可选)

  • 发过来一个不认识的字符
  • 机器就傻了
  • 因为不知道如何表现
  • 于是他会用一个问号对应的字符进行替换
  • U+FFFD �

添加图片注释,不超过 140 字(可选)

  • 这个字符本应该是 unicode 中的字符
  • 但如果硬要用 gbk 解码会如何呢?

乱解码

  • � 对应 utf-16 编码 0xFFFD
  • 转化为 utf-8 对应 0xEF 0xBF 0xBD
  • 但是如果这个编码用 gbk 解码的话
  • 就会出现锟斤拷
  • 锟(0xEFBF)
  • 斤(0xBDEF)
  • 拷(0xBFBD)


添加图片注释,不超过 140 字(可选)

  • 锟斤拷会出现在各种地方
  • 甚至有个笑话
  • 手持两把锟斤拷
  • 口中疾呼烫烫烫


  • 烫烫烫又是怎么回事

烫烫烫和屯屯屯

  • 0xcc 正好是
  • x86指令集中 中断(int 3)指令
  • 起到保护作用


  • 在分配内存的时候
  • 栈内存默认初始数值为 0xcc
  • 0xcccc 用使用 bgk 的终端来表示刚好就是
  • 未初始化的栈空间用 0xcc 填充


添加图片注释,不超过 140 字(可选)

  • 而未初始化的堆空间用 0xcd 填充
  • 所以 0xcdcd 用 gbk 来解释的话,就是


添加图片注释,不超过 140 字(可选)

  • 动态分配的内存被回收之后
  • 就是 DDDD
  • 0xcdcd
  • 在gbk编码格式中
  • 对应汉字



  • 甚至有拼音标号

拼音标号

添加图片注释,不超过 140 字(可选)

  • 符号还在不断增加中

中文字符集进化

  • unicode 如果 2 个字节总共 16 位
  • 16 位最多 65536 各字符
  • 想要把全世界的字符都编码是不现实的
  • 光是中文就超了好几次


添加图片注释,不超过 140 字(可选)

  • 如果使用 3 字节编码就大大增加了存储和带宽的压力
  • 那到底应该怎么办呢?
  • 到底应该按照 1 字节、2 字节还是 3 字节进行读取呢?


总结

  • unicode 里面有各种字体
  • 扑克
  • 国际象棋
  • 麻将
  • 偏旁部首
  • 各种好玩的编码
  • 字符编码就是这样一步步发展过来的


  • 但是有个问题
  • 拜这个字
  • 在字节中应该是b"\x62\xdc"两个字节


添加图片注释,不超过 140 字(可选)

  • 该如何理解b"\x62\xdc"这两个字节呢?🤔
  • 究竟是"拜"
  • 还是"bÜ"呢?


添加图片注释,不超过 140 字(可选)


目录
相关文章
|
26天前
|
人工智能 Shell 开发工具
[oeasy]python062_在python中完成输入和输出_input_print
本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
115 66
|
5天前
|
人工智能 Shell 开发工具
[oeasy]python065python报错怎么办_try_试着来_except_发现异常
本文介绍了Python中处理异常的基本方法,重点讲解了`try`和`except`的用法。通过一个计算苹果重量的小程序示例,展示了如何捕获用户输入错误并进行处理。主要内容包括: 1. **回顾上次内容**:简要回顾了Shell环境、Python3游乐场和Vim编辑器的使用。 2. **编写程序**:编写了一个简单的程序来计算苹果的总重量,但发现由于输入类型问题导致结果错误。 3. **调试与修正**:通过调试发现输入函数返回的是字符串类型,需要将其转换为整数类型才能正确计算。
48 32
|
3天前
|
数据库 Python
[oeasy]python066_如何捕获多个异常_try_否则_else_exception
本文介绍了Python中`try...except...else`结构的使用方法。主要内容包括: 1. **回顾上次内容**:简要复习了`try`和`except`的基本用法,强调了异常处理的重要性。 2. **详细解释**: - `try`块用于尝试执行代码,一旦发现错误会立即终止并跳转到`except`块。 - `except`块用于捕获特定类型的异常,并进行相应的处理。 - `else`块在没有异常时执行,是可选的。 3. **示例代码**:通过具体例子展示了如何捕获不同类型的异常(如`ValueError`和`ZeroDivisionError`),并解释了异常处理
33 24
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
126 80
|
9天前
|
缓存 Shell 开发工具
[oeasy]python064_命令行工作流的总结_vim_shell_python
本文总结了命令行工作流中的关键工具和操作,包括vim、shell和Python。主要内容如下: 1. **上次回顾**:完成了输入输出的代码编写,并再次练习了vim的使用。 2. **shell基础**:介绍了shell环境及其基本命令,如`pwd`、`cd`、`ll -l`等。 3. **Python游乐场**:通过`python3`命令进入Python交互环境,可以进行简单计算和函数调用,常用函数有`help`、`ord`、`chr`等。 4. **vim编辑器**:详细讲解了vim的三种模式(正常模式、插入模式、底行命令模式)及其切换方法,以及常用的底行命令如`:w`、`:q`、`
45 15
|
2月前
|
人工智能 C语言 Python
[oeasy]python051_什么样的变量名能用_标识符_identifier
本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
126 69
|
2月前
|
Python
[oeasy]python050_如何删除变量_del_delete_variable
本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
126 68
|
1月前
|
人工智能 Unix Java
[oeasy]python059变量命名有什么规则_惯用法_蛇形命名法_name_convention_snake
本文探讨了Python中变量命名的几种常见方式,包括汉语拼音变量名、蛇形命名法(snake_case)和驼峰命名法(CamelCase)。回顾上次内容,我们主要讨论了使用下划线替代空格以提高代码可读性。实际编程中,当变量名由多个单词组成时,合理的命名惯例变得尤为重要。
85 9
|
1月前
|
C语言 Python
[oeasy]python058_一句话让python崩了
本文介绍了如何通过重新赋值`__builtins__`使Python环境崩溃,并探讨了下划线的来历及其在编程中的作用。文章回顾了上次内容,展示了覆盖内建模块导致系统崩溃的过程,解释了恢复方法,以及PEP 8规范中关于空格使用的建议。最后,文章总结了下划线在变量定义和提高代码可读性方面的重要性,并简述了其从打字机时代到计算机时代的演变。
34 10
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
51 14

热门文章

最新文章