[oeasy]python0020换行字符_feed_line_lf_反斜杠n_B语言_安徒生童话

简介: [oeasy]python0020换行字符_feed_line_lf_反斜杠n_B语言_安徒生童话

 

换行字符

 

回忆上次内容

    • struct包可以让我们使用封包格式
      • 把数字封包到字节里
        • pack函数负责封包
        • unpack函数负责解封
          • 我们通过封到不同的字节状态
            • 遍历了一次ascii码

            image.gif编辑

             

              • 还是有那片黑色的区域
                • 好像是一片黑暗森林!
                • 那里面到底有些什么秘密?🤔
                  • 我们这次向黑暗森林区域进发!!👊
                  • 整理行装
                  • 出发!

                  chr

                    • 先看看"oeasy"这个字符串是如何存在的🤔

                    image.gif编辑

                      • 字符都对应着一个数字
                        • 数字在计算机上究竟是如何存储的呢?
                        • 用二进制形式存储在字节中的
                          • 可以看看这个二进制形式么?

                          chr

                            • 8bit 构成 byte

                            image.gif编辑

                              • 上图的字节为
                                • (0011 0101)2
                                • (35)16
                                • 对应着字符'5'

                                image.gif编辑

                                  • 那字母呢?🤔
                                  • abcd在内存里长什么样子?

                                  文件编码

                                    • 编写一个文件
                                      • 写下 abcd
                                      • :%!xxd
                                      • :%!xxd -r 变回来

                                      image.gif编辑

                                        • 可以看到文件是用 2进制 方式存储的
                                          • 0x61 - a
                                          • 0x62 - b
                                          • 0x63 - c
                                          • 0x64 - d
                                            • 不论是内存、硬盘还是网络传输
                                              • a 对应
                                                • (0x61)16
                                                • (0b01100001)2
                                                  • 图中最后的那个 0x0a 对应什么字符???

                                                  善用函数

                                                    • 使用chr得到相关字符

                                                    image.gif编辑

                                                      • 0x0a对应的是'\n'这个字符
                                                      • 这个字符好像在哪里见过?🤔

                                                      回到最初

                                                        • 想要了解这个'\n'
                                                          • 我们还得回到最初
                                                            • 我们回到开始的时候

                                                            image.gif编辑

                                                              • 前面介绍过
                                                                • BWK写的 c 语言的第一个程序

                                                                \n

                                                                  • 注意到hello world后面的\n了么?
                                                                    • 注意到hello world后面的\n了么?
                                                                    • 特别注意斜杠的方向
                                                                      • 这个方向\叫反斜杠
                                                                        • 键盘位置在回车键附近

                                                                        image.gif编辑

                                                                          • \n到底是什么??🤔

                                                                          输出"\n"

                                                                            • \n 是一个整体
                                                                              • 占一个字节
                                                                              • 算一个字符
                                                                              • 序号是(10)10进制
                                                                              • 也就是(0x0a)16进制
                                                                              • 这就是在开篇时的abcd后面的字符
                                                                              • \n在内存里显示为一个.

                                                                              image.gif编辑

                                                                                • 我们直接把他输出看看

                                                                                输出

                                                                                  • 输出

                                                                                  #输出\n

                                                                                  print("\n")

                                                                                  #直接print

                                                                                  print()

                                                                                  #查看序号

                                                                                  ord("\n")

                                                                                  #查看十六进制的序号

                                                                                  hex(ord("\n"))

                                                                                    • 输出结果

                                                                                    image.gif编辑

                                                                                      • 好像换了 2
                                                                                        • 如果没\n的话,只换 1
                                                                                        • 如果有\n的话, 就换 2
                                                                                          • 我们看看ascii码表是如何定义的这第10个字符的

                                                                                          找到位置

                                                                                            • 我们已经身在在黑暗森林中
                                                                                              • 找到了一个落脚点

                                                                                              image.gif编辑

                                                                                                • 十进制的10 就是 十六进制的 0x0A
                                                                                                  • 这个数值在 ascii 码表中意思是 LF
                                                                                                    • 啥意思?

                                                                                                    搜索

                                                                                                      • 搜索\n得到的结果是这样的
                                                                                                        • LF 意味着 Line Feed
                                                                                                        • 喂行
                                                                                                        • 喂一行纸

                                                                                                        image.gif编辑

                                                                                                          • 那我真的可以用这个\n在字符中间换行嘛?

                                                                                                          尝试换行

                                                                                                          #输出字符串中带有\n

                                                                                                          print("Hello\nWorld")

                                                                                                            • 在游乐场中尝试

                                                                                                            image.gif编辑

                                                                                                              • 中途换行成功!
                                                                                                              • 可以多来几个换行符吗?

                                                                                                              多来几个

                                                                                                                • 就往里面加\n

                                                                                                                #输出字符串中带有\n

                                                                                                                print("He\nllo\nWor\nld")

                                                                                                                  • 显然这个 \n 就是一个换行
                                                                                                                    • 字符串里面有个 \n 就意味着需要换 1 行
                                                                                                                    • 他的英文是 Line Feed
                                                                                                                    • 意思就是 新换1行
                                                                                                                    • 这个东西其实比 ascii 的历史还要悠久
                                                                                                                    • 从打字机的时代就有了

                                                                                                                    image.gif编辑

                                                                                                                      • 为什么要有换行符呢?

                                                                                                                      换行符

                                                                                                                        • 最最开始的时候分段落
                                                                                                                          • 都是靠打字机输出空格完成换行
                                                                                                                          • 自从有了这个LineFeed
                                                                                                                          • 一个键就直接换行了
                                                                                                                          • 所以LineFeed 极大地提高了效率

                                                                                                                          image.gif编辑

                                                                                                                            • 两个换行符就换两行
                                                                                                                            • 可以使用chr函数么?

                                                                                                                            使用序号得到换行符

                                                                                                                            #输出ascii值为10的字符

                                                                                                                            chr(10)

                                                                                                                            #把这个字符放在print里面输出

                                                                                                                            print("hello"+chr(10)+"world")

                                                                                                                            image.gif编辑

                                                                                                                              • 纯文本中也会有回车符么?
                                                                                                                              • 我们去看看纯文本文件

                                                                                                                              打开文本文档

                                                                                                                              https://github.com/overmind1980/oeasy-python-tutorial.git

                                                                                                                              vi oeasy-python-tutorial/samples/000016/anderson_fairy_tales.txt

                                                                                                                                • 首先下载这个仓库
                                                                                                                                • 然后找到其中的安德森仙话这个本书

                                                                                                                                image.gif编辑

                                                                                                                                  • 我们发现这个东西是318K
                                                                                                                                  • 那他有多少字符呢?

                                                                                                                                  字符数量

                                                                                                                                    • 1个英文字符占一个字节
                                                                                                                                      • 318k大概有318000个字节
                                                                                                                                      • 大概是31.8万个字符

                                                                                                                                      image.gif编辑

                                                                                                                                        • 这就是文本文件的形式
                                                                                                                                        • 第一行的Andersen后面有应该有两个换行符
                                                                                                                                        • 是不是呢真有换行符呢?

                                                                                                                                        字节形式

                                                                                                                                          • 所有行转化为字节形式
                                                                                                                                            • %!xxd
                                                                                                                                              • 查找0a
                                                                                                                                                • /0a

                                                                                                                                                image.gif编辑

                                                                                                                                                  • 确实能够找到那两个换行符(0a)
                                                                                                                                                  • 这可以和纯文本方式对应起来吗?

                                                                                                                                                  纯文本方式

                                                                                                                                                    • 文本中的换行
                                                                                                                                                      • 其实就是换行符的效果
                                                                                                                                                        • 在文本观看模式下是换行

                                                                                                                                                        image.gif编辑

                                                                                                                                                          • 在字节观看模式下是0a

                                                                                                                                                          image.gif编辑

                                                                                                                                                            • 这本书后来被翻译成安徒生童话

                                                                                                                                                            安徒生童话

                                                                                                                                                              • 里面有很多耳熟能详的故事
                                                                                                                                                                • 《皇帝的新装》
                                                                                                                                                                • 《海的女儿》
                                                                                                                                                                • 《丑小鸭》
                                                                                                                                                                • 《红舞鞋》
                                                                                                                                                                • 《卖火柴的小女孩》
                                                                                                                                                                • 《拇指姑娘》

                                                                                                                                                                image.gif编辑

                                                                                                                                                                  • 在安徒生所处的时代(1805-1875)
                                                                                                                                                                    • 丹麦仍是一个君主专制主义社会
                                                                                                                                                                    • 20年代经济衰退
                                                                                                                                                                    • 童话用儿童视角透视复杂生活
                                                                                                                                                                    • 万物有灵
                                                                                                                                                                    • 风趣幽默
                                                                                                                                                                      • Jean Hersholt
                                                                                                                                                                        • 将160个故事从丹麦文翻译成英文
                                                                                                                                                                          • 刘半农 1914年
                                                                                                                                                                            • 翻译了《皇帝的新衣》开始
                                                                                                                                                                              • 叶君健 1944年到1949年
                                                                                                                                                                                • 翻译了 安徒生童话全集
                                                                                                                                                                                  • 互联网时代
                                                                                                                                                                                    • 英文版安徒生童话被谷腾堡项目所收录

                                                                                                                                                                                    落实

                                                                                                                                                                                      • 文档当中就是用0和1来表示字符的
                                                                                                                                                                                      • 如下图所示
                                                                                                                                                                                        • 文字是蓝色的
                                                                                                                                                                                        • 字节是黑色的

                                                                                                                                                                                        image.gif编辑

                                                                                                                                                                                          • 为什么\n会用来表示换行(Line-Feed)呢?

                                                                                                                                                                                          追溯历史

                                                                                                                                                                                            • c语言 中的 \n 来自于什么呢?
                                                                                                                                                                                              • 来自于 B语言
                                                                                                                                                                                              • B语言 是里奇和汤普逊最早开发 unix 的语言
                                                                                                                                                                                              • B语言 1969 年 就 运行在bell实验室PDP-8
                                                                                                                                                                                                • 1971 年里奇和汤普逊开始对于 B语言 进行改造
                                                                                                                                                                                                  • 在新买的 PDP-11 上用 B语言B语言 写扩展,称之为 NewB
                                                                                                                                                                                                  • 1973 年 NewB 基本主体完成
                                                                                                                                                                                                    • 改名叫 c语言
                                                                                                                                                                                                      • 所以 c 其实是 NewB
                                                                                                                                                                                                        • 他们用手头的编译器和c语言PDP-11 重写了一个 Unix Kernel
                                                                                                                                                                                                          • 机器语言和汇编语言本来不具有移植性
                                                                                                                                                                                                          • 就像x86的二进制程序不能直接运行在arm上
                                                                                                                                                                                                          • 需要移植
                                                                                                                                                                                                            • c语言 程序却可以在 很多架构 的处理器上编译运行
                                                                                                                                                                                                              • 只要那种架构的处理器具有对应的 c语言编译器和库
                                                                                                                                                                                                              • 那就能顺利编译成针对该处理器架构的二进制程序
                                                                                                                                                                                                              • 甚至能实现跨平台编译
                                                                                                                                                                                                                • 也就是今天所说的交叉编译
                                                                                                                                                                                                                  • 这就是 c语言 在当时能够发展的原因

                                                                                                                                                                                                                  image.gif编辑

                                                                                                                                                                                                                    • c语言 源自 B语言
                                                                                                                                                                                                                    • B语言 也不是凭空创造的
                                                                                                                                                                                                                      • 源自什么呢?

                                                                                                                                                                                                                      Basic Combined Programming Language(BCPL)

                                                                                                                                                                                                                        • B语言 源自BCPL(Basic Combined Programming Language)
                                                                                                                                                                                                                          • 1967 年由剑桥大学的 Matin Richards 制作

                                                                                                                                                                                                                          image.gif编辑

                                                                                                                                                                                                                            • 在同样由剑桥大学开发的 CPL语言 上改进而来
                                                                                                                                                                                                                              • BCPL 最早被用做牛津大学的 OS6操作系统 上面的开发工具

                                                                                                                                                                                                                              image.gif编辑

                                                                                                                                                                                                                                • 后来通过美国贝尔实验室的改进和推广成为了 UNIX 上的常用开发语言
                                                                                                                                                                                                                                  • 最早 BCPL 语言的样子就有个类似于l(ine)f(eed)的符号
                                                                                                                                                                                                                                  • 这是关于换行符表示法 最早的记录
                                                                                                                                                                                                                                  • 当时的换行符长什么样呢?

                                                                                                                                                                                                                                  BCPL的换行符

                                                                                                                                                                                                                                    • 当时的换行符长成这样
                                                                                                                                                                                                                                      • !\*n

                                                                                                                                                                                                                                      image.gif编辑

                                                                                                                                                                                                                                        • 上述程序的目是
                                                                                                                                                                                                                                          • 输出 hello,world
                                                                                                                                                                                                                                          • 然后再来个回车
                                                                                                                                                                                                                                            • 所以hello world
                                                                                                                                                                                                                                              • 并不是c语言的发明
                                                                                                                                                                                                                                              • 而是从c语言的爷爷bcpl那时候就有了
                                                                                                                                                                                                                                              • 并且从bcpl时代就已经作为迷因(meme)开始传播
                                                                                                                                                                                                                                                • python虚拟机的可执行文件
                                                                                                                                                                                                                                                • 也就是pyc文件是如何理解换行符的呢?

                                                                                                                                                                                                                                                反汇编(disassemble)

                                                                                                                                                                                                                                                  • 观察一下

                                                                                                                                                                                                                                                  image.gif编辑

                                                                                                                                                                                                                                                    • \n出现在字符串常量中
                                                                                                                                                                                                                                                    • 能在pyc中找到这个常量么?

                                                                                                                                                                                                                                                    先编译

                                                                                                                                                                                                                                                      • 将py文件编译成pyc文件

                                                                                                                                                                                                                                                      image.gif编辑

                                                                                                                                                                                                                                                        • 再观察

                                                                                                                                                                                                                                                        pyc文件

                                                                                                                                                                                                                                                          • 打开pyc文件

                                                                                                                                                                                                                                                          image.gif编辑

                                                                                                                                                                                                                                                            • 确实能够找到a和s之间的\n
                                                                                                                                                                                                                                                            • 也就是(0a)16进制
                                                                                                                                                                                                                                                            • 任务完成!!!

                                                                                                                                                                                                                                                            总结

                                                                                                                                                                                                                                                              • \n 就是换行符号
                                                                                                                                                                                                                                                                • 换行符对应着 ascii 字符的代码是(10)10进制
                                                                                                                                                                                                                                                                • 换行符的英文是 LF
                                                                                                                                                                                                                                                                • 意思是Line Feed
                                                                                                                                                                                                                                                                  • 我们可以在《安徒生童话》的文本中
                                                                                                                                                                                                                                                                    • 找到每个字符对应的字节形态

                                                                                                                                                                                                                                                                    image.gif编辑

                                                                                                                                                                                                                                                                      • 不光txt文件是文件
                                                                                                                                                                                                                                                                        • 我们的python游乐场本质上也是一个二进制可执行的文件
                                                                                                                                                                                                                                                                        • 这个文件在哪?
                                                                                                                                                                                                                                                                          相关文章
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          18天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Unix Linux 程序员
                                                                                                                                                                                                                                                                          [oeasy]python053_学编程为什么从hello_world_开始
                                                                                                                                                                                                                                                                          视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
                                                                                                                                                                                                                                                                          102 80
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          25天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          人工智能 C语言 Python
                                                                                                                                                                                                                                                                          [oeasy]python051_什么样的变量名能用_标识符_identifier
                                                                                                                                                                                                                                                                          本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
                                                                                                                                                                                                                                                                          113 69
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          27天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Python
                                                                                                                                                                                                                                                                          [oeasy]python050_如何删除变量_del_delete_variable
                                                                                                                                                                                                                                                                          本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
                                                                                                                                                                                                                                                                          111 68
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          7天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Python
                                                                                                                                                                                                                                                                          [oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
                                                                                                                                                                                                                                                                          本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
                                                                                                                                                                                                                                                                          29 14
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          2天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          存储 Python
                                                                                                                                                                                                                                                                          [oeasy]python056_python中下划线是什么意思_underscore_理解_声明与赋值_改名字
                                                                                                                                                                                                                                                                          在Python中,下划线有多种用途。单下划线(_)常用于避免命名冲突,如将`max`改为`max_`以保留内置函数功能。双下划线(__var__)通常用于特殊方法和属性,如`__name__`、`__doc__`等。此外,单下划线(_)在交互式解释器中表示上一次表达式的值,但不建议作为普通变量名使用。总结:下划线用于避免命名冲突及特殊标识。
                                                                                                                                                                                                                                                                          9 1
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          16天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          C语言 Python
                                                                                                                                                                                                                                                                          [oeasy]python054_python有哪些关键字_keyword_list_列表_reserved_words
                                                                                                                                                                                                                                                                          本文介绍了Python的关键字列表及其使用规则。通过回顾`hello world`示例,解释了Python中的标识符命名规则,并探讨了关键字如`if`、`for`、`in`等不能作为变量名的原因。最后,通过`import keyword`和`print(keyword.kwlist)`展示了Python的所有关键字,并总结了关键字不能用作标识符的规则。
                                                                                                                                                                                                                                                                          29 9
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          24天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Unix 编译器 C语言
                                                                                                                                                                                                                                                                          [oeasy]python052_[系统开发语言为什么默认是c语言
                                                                                                                                                                                                                                                                          本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
                                                                                                                                                                                                                                                                          26 5
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          29天前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Shell Python
                                                                                                                                                                                                                                                                          [oeasy]python049_[词根溯源]locals_现在都定义了哪些变量
                                                                                                                                                                                                                                                                          本文介绍了Python中`locals()`函数的使用方法及其在调试中的作用。通过回顾变量赋值、连等赋值、解包赋值等内容,文章详细解释了如何利用`locals()`函数查看当前作用域内的本地变量,并探讨了变量声明前后以及导入模块对本地变量的影响。最后,文章还涉及了一些与“local”相关的英语词汇,如`locate`、`allocate`等,帮助读者更好地理解“本地”概念在编程及日常生活中的应用。
                                                                                                                                                                                                                                                                          35 9
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          1月前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          Python 容器
                                                                                                                                                                                                                                                                          [oeasy]python048_用变量赋值_连等赋值_解包赋值_unpack_assignment _
                                                                                                                                                                                                                                                                          本文介绍了Python中变量赋值的不同方式,包括使用字面量和另一个变量进行赋值。通过`id()`函数展示了变量在内存中的唯一地址,并探讨了变量、模块、函数及类类型的地址特性。文章还讲解了连等赋值和解包赋值的概念,以及如何查看已声明的变量。最后总结了所有对象(如变量、模块、函数、类)都有其类型且在内存中有唯一的引用地址,构成了Python系统的基石。
                                                                                                                                                                                                                                                                          30 5
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                                                          存储 Python 容器
                                                                                                                                                                                                                                                                          [oeasy]python045_[词根溯源]赋值_assignment_usage_使用
                                                                                                                                                                                                                                                                          本文回顾了上一次讲解的内容,重点讨论了变量的概念及其在各种系统和游戏中的应用。文章详细解释了变量的声明与赋值操作,强调了赋值即为将具体值存储到变量名下的过程。同时,通过例子说明了字面量(如数字0)不能被赋值给其他值的原因。此外,还探讨了“赋值”一词的来源及其英文表达“assignment”的含义,并简要介绍了与之相关的英语词汇,如sign、assign、signal等。最后,总结了本次课程的核心内容,即赋值操作的定义和实现方式。
                                                                                                                                                                                                                                                                          29 3