各种符号 回忆上次内容
- 中文字符可以有各种分类方法
- 声母
- 拼音检字法
- 韵母
- 合辙押韵的分类
- 偏旁部首
- 实际上unicode的排序方法
添加图片注释,不超过 140 字(可选)
- 我们以前勇闯地下城时候获得了一把屠龙宝刀
- 给他镶上了❤️宝石
- 这宝石应该如何理解?
- 今天我们就来彻底解密红色爱心的原理
闭环
- 首先是文字
- 我们的汉字可以构成一个闭环
添加图片注释,不超过 140 字(可选)
- 这♥也可以构成一个闭环吗?
构成闭环
添加图片注释,不超过 140 字(可选)
- 这种编解码方式是unicode-escape
- 也可以构成闭环
添加图片注释,不超过 140 字(可选)
- 这符号最初怎么来的呢?
插入符号
- 搜索出来的
添加图片注释,不超过 140 字(可选)
- ♠ ♣ ♥ ♦
- 把字符复制下来
- 然后粘到系统里面观察
- 类似的有很多好玩的东西
- ꧁༺新闻༒计算༻꧂
- ༺动院༒编程༻
- 加到名字里感觉萌萌哒
- ლ(′◉❥◉`ლ)
输出符号
- 这些其实都是uncode字符
添加图片注释,不超过 140 字(可选)
- 这个东西是可以作为字符串里的字符输出的
- 但是他的 ordinal (序号) 是多少呢?
得到序号
添加图片注释,不超过 140 字(可选)
- 通过字符得到序号 ord
- 反过来通过序号得到字符 chr
- 输出红心试试
添加图片注释,不超过 140 字(可选)
- 真的可以
- 这个红桃符号在存储和传输的时候传的都是二进制形式
- 可以看看红桃的序号的 16进制 或者 2进制 形式么 ?
16 进制
添加图片注释,不超过 140 字(可选)
- 字符可以拼合
- 前面一个 \u
- 后面加上 4位 16进制 数
- 就可以进行输出字符
- 好像是又在\转义(escape)了
- 这次的转义序列是\u2660
- 黑红梅方都可以有对应序号么?
- 不要翻篇
- 上下找找
- 自己试试
遍历花色
- 从0x2660到0x2670
- 将这16个数字对应的字符进行输出
添加图片注释,不超过 140 字(可选)
- 他们分别都是多少呢?
遍历扑克
添加图片注释,不超过 140 字(可选)
- 选出实心的黑红梅方
转义
添加图片注释,不超过 140 字(可选)
- 我想要的不是默认红
- 我想要纯红色的大红心
- 怎么办?
回忆颜色
- 高亮基础色
添加图片注释,不超过 140 字(可选)
- 然后我们了解了\33[38;5;XXXm 索引颜色
- 每个颜色 0-5 总共 6 级
添加图片注释,不超过 140 字(可选)
- 甚至可以用RGB得到各种颜色
- \33[38;2;R;G;Bmoeasy\33[0m
- 颜色真不少了
- 我想用大红色画个桃心 ♥️
- 有可能吗??🤔
大红心
添加图片注释,不超过 140 字(可选)
- \33[38;5;196
- 使用索引色
- 196 = 16 + 625 + 610 + 60*0
- 红色打满
添加图片注释,不超过 140 字(可选)
- rgb形式 也没有问题
- 那么 红色方板 应该怎么做呢?
添加图片注释,不超过 140 字(可选)
- 这个\u 又是什么意思呢?
- 好像是也是一种通过数字找到对应字符的方法
- 以前都有什么通过数字找字符的方法呢?
ascii
- 最基础的肯定是ascii
sudo apt install ascii ascii
添加图片注释,不超过 140 字(可选)
输出字符
- 可以用\输出字符
- \xhh
- x意味着hexdecimal
- h 是十六进制数子
- \ooo
- o 是八进制数字
添加图片注释,不超过 140 字(可选)
- 不要翻页
- 再复习 如何用chr函数
- 通过 数字直接输出oeasy字符串
输出
添加图片注释,不超过 140 字(可选)
- 尝试用16进制和8进制输出
数字化输出
添加图片注释,不超过 140 字(可选)
- 可是这个\u 究竟是什么呢?
添加图片注释,不超过 140 字(可选)
- 不会了就去搜帮助
查看帮助
添加图片注释,不超过 140 字(可选)
- 查找关于字符串的帮助
- 具体转义序列语法如下
添加图片注释,不超过 140 字(可选)
- \nnn 8 进制
- \xhh 16 进制
- \uhhhh 4 位的 Unicode 编码
- \Uhhhhhhhh 8 位的 Unicode 编码
- 那我们胡乱来试试吧
具体试试
- \u后面
- 4 位 16 进制数
- 对应一个字符
添加图片注释,不超过 140 字(可选)
- 这种对应关系就像ascii
- ascii
- 7 位 2进制数 对应一个字符
- unicode
- 范围更广
- 字符更多
- 其中中文标点
- 我们要特别注意
调出中文标点
- 点击桌面的sogou输入法
- 开启中文输入法模式
添加图片注释,不超过 140 字(可选)
- 可以切换
- 中英文输入法
- 全角半角
编程注意
- 编程的时候
- 只能使用英文标点
- 不能使用中文标点
- 这是为什么呢?
添加图片注释,不超过 140 字(可选)
- 注意下图的括号不是半角的
原理
- 中文括号和英文括号对应的根本不是一个序号
- python解释器解释不下去
- 就会报错了
添加图片注释,不超过 140 字(可选)
- 引号,逗号等符号都要使用英文半角的
- 在哪里切换标点的全角半角呢?
切换全角半角标点
- 下图红框位置就是切换全角半角标点的位置
添加图片注释,不超过 140 字(可选)
- 可以切换中英文标点
- 那旁边的月亮怎么理解呢?
全角半角英文字符
- 圆月是全角英文
- 半月是半角英文
添加图片注释,不超过 140 字(可选)
- 为什么会有全角英文字符呢?
全角英文
添加图片注释,不超过 140 字(可选)
- 序号位置在中文之后
添加图片注释,不超过 140 字(可选)
- 最初目的是和中文字符等宽
- 其实也可以生成一系列特殊词元token
- 因为这些词元看起来是英文单词
- 但实际上并不是
- 这应该是一块有趣的区域!
- 另外汉语拼音字符
- 应该如何理解呢?
汉语拼音
- 汉语拼音符号:ā á ǎ à ō ó ǒ ò ē é ě è ī í ǐ ì ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ ń ň ǹ ɡ
添加图片注释,不超过 140 字(可选)
- 这些序号
- 好像并不是连续的
- 可以将他们一起解码吗?
观察unicode编码
- unicode中并没有汉语拼音block
添加图片注释,不超过 140 字(可选)
- 我们把各个地方散乱的字符
- 当做汉语拼音来用...
添加图片注释,不超过 140 字(可选)
- ǖ ǘ ǚ ǜ ü 也是来自于拉丁语扩展
更多拼音
- 闽南语、粤语等方言的音调更多
- https://www.iamwawa.cn/yuepin.html
添加图片注释,不超过 140 字(可选)
- 也有相应的拼音字符
1.[á]/[â] 2.[ǎ] 3.[ā] 4.[a̖]/[ȁ] 5.[a̗] 6.[à] 总结
- 这次再次输出了大红心<span style="color:red">♥</span>
- 找到了红心对应的编码
- 黑红梅方都对应有编码
- 原来的编码叫做 ascii️
- \u这种新的编码方式叫unicode
- unicode还可以有什么样好玩的字符呢?🤔
- 下次再说!👋
- 蓝桥->https://www.lanqiao.cn/courses/3584
- github->https://github.com/overmind1980/oeasy-python-tutorial
- gitee->https://gitee.com/overmind1980/oeasypython