[Python学习] 专题四.文件基础知识

简介:

        前面讲述了函数、语句和字符串的基础知识,该篇文章主要讲述文件的基础知识(与其他语言非常类似).

一. 文件的基本操作

        文件是指存储在外部介质(如磁盘)上数据的集合.文件的操作流程为:
       
打开文件(读方式\写方式)->读写文件(read\readline\readlines\write\writelines)->关闭文件
       
1.打开文件
       
调用函数open打开文件,其函数格式为:
                         
file_obj=open(filename[, mode[, buffering]]) 返回一个文件对象(file object)
                                — filename文件名(唯一强制参数)
                                                ·原始字符串 r'c:\temp\test.txt'
                                                ·转移字符串 'c:\\temp\\test.txt'

                               
— mode文件模式
                                               ·r 读模式
                                               ·w 写模式
                                               ·a 追加模式(写在上次后面)
                                               ·+ 读/写模式(没有文件即创建,可添加到其他模式中使用)
                                               ·b 二进制模式(可添加到其他模式中使用)

                               
— buffering缓冲(可选参数)
                                              
·参数=0或False 输入输出I/O是无缓冲的,所有读写操作针对硬盘
                                               ·参数=1或True 输入输出I/O是有缓冲的,内存替代硬盘
                                               ·参数>1数字代表缓冲区的大小,单位字节.-1或负数代表使用默认缓冲区大小

        
注意:当处理二进制文件如声音剪辑或图像时使用'b'二进制模式,可以'rb'读取一个二进制文件.
        2.关闭文件

        应该牢记使用close方法关闭文件,因为Python可能会缓存(出于效率考虑把数据临时存储某处)写入数据,如果程序突然崩溃,数据根本不会被写入文件,为安全起见,在使用完文件后关闭.如果想确保文件被关闭,应该使用try/finally语句,并且在finally子句中调用close方法.如:
        #Open your file
        try:
             #Write data to your file
        finally:
            file.close()

        3.读写文件
        调用函数write方法向文件中写入数据,其函数格式为:
                        
file_obj.write(string) 参数string会被追加到文件中已存部分后面
                         file_obj.writelines(sequence_of_strings) 仅传递一个参数,列表[ ] 元组() 字典{}
       
注意:实用字典时字符串的顺序出现是随机的.

#使用write()写文件
file_obj=open('test.txt','w')
str1='hello\n'
str2='world\n'
str3='python'
file_obj.write(str1)
file_obj.write(str2)
file_obj.write(str3)
file_obj.close()
#使用writelines()写文件
file_obj=open('test.txt','w')
str1='hello\n'
str2='world\n'
str3='python'
file_obj.writelines([str1,str2,str3])
file_obj.close()
#输出 本地test.txt文件
hello
word
python

        调用函数read方法读取数据,其函数格式为:var=file_obj.read(),其中read全部读取,返回string;readline读取一行,返回string;readlines读取文件所有行,返回a list of string.例:

#使用read
print 'Use the read'
file_obj=open('test.txt','r')
s=file_obj.read()
print s
file_obj.close
#使用readline
print 'Use the readline'
file_obj=open('test.txt','r')
line1=file_obj.readline()
line1=line1.rstrip('\n')
print 'l1 ',line1
line2=file_obj.readline()
line2=line2.rstrip('\n')
print 'l2 ',line2
line3=file_obj.readline()
line3=line3.rstrip('\n')
print 'l3 ',line3
file_obj.close
#使用readlines
print 'Use the readlines'
file_obj=open('test.txt','r')
li=file_obj.readlines()
print li
file_obj.close

        输出内容如下:

Use the read
hello
world
python
Use the readline
l1  hello
l2  world
l3  python
Use the readlines
['hello\n', 'world\n', 'python']

       可以发现在使用readline()函数时它返回的结果是'hello\n'字符串,需要使用rstrip去除'\n',否则print输出时总空一行.同时写入文件时使用格式化写入比较方便,如s="xxx%dyyy%s\n"%(28,'csdn').

#格式化写入
fd=open('format.txt','w')
head="%-8s%-10s%-10s\n"%('Id','Name','Record')
fd.write(head)
item1="%-8d%-10s%-10.2f\n"%(10001,'Eastmount',78.9)
fd.write(item1)
item2="%-8d%-10s%-10.2f\n"%(10002,'CSDN',89.1234)
fd.write(item2)
fd.close()
#输出
Id      Name      Record    
10001   Eastmount 78.90     
10002   CSDN      89.12  

二. 文件与循环

        前面介绍了文件的基本操作和使用方法,但是文件操作通常会与循环联系起来,下面介绍while循环和for循环实现文件操作.代码如下:

#使用while循环
fr=open('test.txt','r')
str=fr.readline()
str=str.rstrip('\n')
while str!="":
    print str
    str=fr.readline()
    str=str.rstrip('\n')
else:
    print 'End While'
fr.close
#使用for循环
rfile=open('test.txt','r')
for s in rfile:
    s=s.rstrip('\n')
    print s
print 'End for'
rfile.close()

        其中for调用迭代器iterator,迭代器提供一种方法顺序访问一个聚合对象中的各个元素,它相当于通过Iter函数获取对象的迭代器,再通过next函数(该方法调用时不需要任何参数)获取下一个值.for可以遍历iterator_obj包括List\String\Tuple\Dict\File.如:
        s='www.csdn.net'
        si=iter(s)          #生成迭代器
        print si.next()  #调用next依次获取元素,最后迭代器没有返回值时引发StopIteration异常

三. 总结

        该篇文章主要讲述了Python文件基础知识,包括文件的打开、读写、关闭操作、使用循环读写文件及迭代器的知识.希望对大家有所帮助,如果有错误或不足之处,还请海涵!
        
(By:Eastmount 2014-10-8 中午11点 原创CSDN http://blog.csdn.net/eastmount/
)
       
参考资料:
        1.
51CTO学院 智普教育的python视频
http://edu.51cto.com/course/course_id-581.html
        2.《Python基础教程(第2版)》Magnus Lie Hetland[挪]著

目录
相关文章
|
3月前
|
数据库 Python
Python学习的自我理解和想法(18)
这是我在学习Python第18天的总结,内容基于B站千锋教育课程,主要涉及面向对象编程的核心概念。包括:`self`关键字的作用、魔术方法的特点与使用(如构造函数`__init__`和析构函数`__del__`)、类属性与对象属性的区别及修改方式。通过学习,我初步理解了如何利用这些机制实现更灵活的程序设计,但深知目前对Python的理解仍较浅显,欢迎指正交流!
|
2月前
|
安全 数据安全/隐私保护 Python
Python学习的自我理解和想法(27)
本文记录了学习Python第27天的内容,主要介绍了使用Python操作PPTX和PDF的技巧。其中包括通过`python-pptx`库创建PPTX文件的详细步骤,如创建幻灯片对象、选择母版布局、编辑标题与副标题、添加文本框和图片,以及保存文件。此外,还讲解了如何利用`PyPDF2`库为PDF文件加密,涵盖安装库、定义函数、读取文件、设置密码及保存加密文件的过程。文章总结了Python在处理文档时的强大功能,并表达了对读者应用这些技能的期待。
|
3月前
|
数据采集 机器学习/深度学习 自然语言处理
Python学习的自我理解和想法(16)
这是我在B站千锋教育课程中学Python的第16天总结,主要学习了`datetime`和`time`模块的常用功能,包括创建日期、时间,获取当前时间及延迟操作等。同时简要介绍了多个方向的补充库,如网络爬虫、数据分析、机器学习等,并讲解了自定义模块的编写与调用方法。因开学时间有限,内容精简,希望对大家有所帮助!如有不足,欢迎指正。
|
29天前
|
人工智能 索引 Python
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
47 5
|
23天前
|
数据采集 存储 监控
抖音直播间采集提取工具,直播间匿名截流获客软件,Python开发【仅供学习】
这是一套基于Python开发的抖音直播间数据采集与分析系统,包含观众信息获取、弹幕监控及数据存储等功能。代码采用requests、websockets和sqlite3等...
|
3月前
|
Python
Python学习的自我理解和想法(19)
这是一篇关于Python面向对象学习的总结,基于B站千锋教育课程内容编写。主要涵盖三大特性:封装、继承与多态。详细讲解了继承(包括构造函数继承、多继承)及类方法与静态方法的定义、调用及区别。尽管开学后时间有限,但作者仍对所学内容进行了系统梳理,并分享了自己的理解,欢迎指正交流。
|
2月前
|
存储 搜索推荐 算法
Python学习的自我理解和想法(28)
本文记录了学习Python第28天的内容——冒泡排序。通过B站千锋教育课程学习,非原创代码。文章详细介绍了冒泡排序的起源、概念、工作原理及多种Python实现方式(普通版、进阶版1和进阶版2)。同时分析了其时间复杂度(最坏、最好、平均情况)与空间复杂度,并探讨了实际应用场景(如小规模数据排序、教学示例)及局限性(如效率低下、不适用于高实时性场景)。最后总结了冒泡排序的意义及其对初学者的重要性。
|
2月前
|
Python
Python学习的自我理解和想法(26)
这是一篇关于使用Python操作Word文档的学习总结,基于B站千锋教育课程内容编写。主要介绍了通过`python-docx`库在Word中插入列表(有序与无序)、表格,以及读取docx文件的方法。详细展示了代码示例与结果,涵盖创建文档对象、添加数据、设置样式、保存文件等步骤。虽为开学后时间有限下的简要记录,但仍清晰梳理了核心知识点,有助于初学者掌握自动化办公技巧。不足之处欢迎指正!
|
3月前
|
数据采集 数据挖掘 Python
Python学习的自我理解和想法(22)
本文记录了作者学习Python第22天的内容——正则表达式,基于B站千锋教育课程。文章简要介绍了正则表达式的概念、特点及使用场景(如爬虫、数据清洗等),并通过示例解析了`re.search()`、`re.match()`、拆分、替换和匹配中文等基本语法。正则表达式是文本处理的重要工具,尽管入门较难,但功能强大。作者表示后续会深入讲解其应用,并强调学好正则对爬虫学习的帮助。因时间有限,内容为入门概述,不足之处敬请谅解。
|
3月前
|
设计模式 数据库 Python
Python学习的自我理解和想法(20)
这是我在B站千锋教育课程中学习Python第20天的总结,主要涉及面向对象编程的核心概念。内容包括:私有属性与私有方法的定义、语法及调用方式;多态的含义与实现,强调父类引用指向子类对象的特点;单例设计模式的定义、应用场景及实现步骤。通过学习,我掌握了如何在类中保护数据(私有化)、实现灵活的方法重写(多态)以及确保单一实例(单例模式)。由于开学时间有限,内容简明扼要,如有不足之处,欢迎指正!

推荐镜像

更多