Python知识点——文件和数据格式化

简介: Python知识点——文件和数据格式化

文件的打开

文件的打开模式
文件打开模式 描述
‘r’ 只读模式,默认值,如果文件不存在,返回FileNotFoundError
'w' 覆盖写模式,文件不存在则创建,存在则完全覆盖
'x' 创建写模式,文件不存在则创建,存在则返回FileExistsError
‘a’ 追加写模式,文件不存在则创建,存在则在文件最后追加内容
‘b’ 二进制文件模式
‘t’ 文本文件模式,默认值
‘+’

与r/w/a一同使用,在原功能基础上增加同时读写功能

文件的路径

<变量名>  = open(<文件名>,<打开模式>)

注:与源文件同目录,可省略路径

“D:/PYE/f.txt”        “./PYE/f.txt”

”D:\\YE\\f.txt“        "f.txt"

文件打开示例

f = open("f.txt")                            文本形式、只读模式、默认值

f = open("f.txt","rt")                      文本形式、只读模式、同默认值

f = open("f.txt","w")                      文本形式、覆盖写模式

f = open("f.txt","a+")                  文本形式、追加写模式+ 读文件

f = open("f.txt","x")                    文本形式、创建写模式

f= open("f.txt","b")                       二进制形式、只读模式

f = open("f.txt","wb")                 二进制形式、覆盖写模式


文件的关闭

<变量名>.close()

#文本形式打开文件

tf = open("f.txt","rt")

print(tf.readline())

tf.close()

#二进制形式打开文件

bf = open("f.txt","rb")

print(bf.readline())

bf.close()

文件内容读取

操作方法 描述
<f>.read(size=-1)

读入全部内容,如果加入参数size,表示读入前size长度的内容

>>>s = f.read(2)

中国

<f>.readline(size=-1)

读入一行内容,如果加入参数size,表示读入改行前size长度的内容

>>>s = f.readline()

中国是一个伟大的国家!

f>.readlines(hint=-1)

读入文件所有行,以每行为元素形成列表如果给出hint,读入文件内对应字节数hint的当前行为止

>>>s = f.readlines()

['中国是一个伟大的国家! ]

文件的读取

方法一:一次性读入

fname = input("请输入要打开的文件名称:")

fo = open(fname,"r")

txt = fo.read()       #对全文txt进行处理

fo.close()

方法二:按数量读入

fname = input("请输入要打开的文件名称:")

fo = open(fname,"r")

txt = fo.read(2)

while txt != ” “:

       #对txt进行处理

       txt = fo.read(2)

fo.close()

方法三: 一次读入,按行处理

fname = input("请输入要打开的文件名称:")

fo = open(fname,"r")

for line in fo.readlines():

       print(line)

fo.close()

方法四:分行读入,逐行处理

fname = input("请输入要打开的文件名称:")

fo = open(fname,"r")

for line in fo:

       print(line)

fo.close()

文件的写入

操作方法 描述
<f>.write(s)

 向文件写入一个字符串或字节流

  >>>f.write("中国是一个伟大的国家!")

<f>.writelines(lines)

 将一个元素全为字符串的列表写入文件

  >>>ls = ["中国", "法国", "美国"]

  >>>f.writelines(ls)

 中国法国美国

f>.seek(offset[,whence])

改变当前文件操作指针的位置,offset开始的偏移量,whence可选,默认为0,含义如下:

0-文件开头;

1- 当前位置;

2- 文件结尾

>>>f.seek(0)        #回到文件开头

例题:写入一个字符串列表的两种方法

fo = open("output .txt","w+“)

ls = ["中国","法国","美国"]


fo.writelines(ls)

for line in fo:

print(line)


fo.close()


#没有任何输出


fo = open("output .txt","w+")


ls = ["中国","法国","美国"]


fo.writelines(ls)


fo.seek(0)

for line in fo:


       print(line)


fo.close()


#输出中国法国美国

例题

自动轨迹绘制

有如下data.txt文件

链接:https://pan.baidu.com/s/1Rt5PD5OPwQpyzJwOoA35Yg 

提取码:ghoc

以第一行为例:300 :行进距离        0:转向判断(0:左转,1:右转)        144:转向角度  

1,0,0:RGB三个通道颜色

#AutoTraceDraw.py
import turtle as t
t.title('自动轨迹绘制')
t.setup(800, 600, 0, 0)
t.pencolor("red")
t.pensize(5)
#数据读取
datals = []
f = open("data.txt")
for line in f:
    line = line.replace("\n","")
    datals.append(list(map(eval, line.split(","))))
f.close()
#自动绘制
for i in range(len(datals)):
    t.pencolor(datals[i][3],datals[i][4],datals[i][5])
    t.fd(datals[i][0])
    if datals[i][1]:
        t.right(datals[i][2])
    else:
        t.left(datals[i][2])

能够绘制以下图形,大家可以复制粘贴看看绘制流程:

给出相应星座,输出相应星座日期:

链接:https://pan.baidu.com/s/1Y-cGAmThpFfqpygCs6zd0A 

提取码:xtez

import pandas as pd
 
with open('D:\\SunSign.csv',encoding='UTF-8') as txt:
    f=txt.read()
names=[]
datas=[]
 
for line in f.split("\n"):
    line=line.replace("\n","")
    datas.append(line.split(","))
    names.append(line.split(",")[0])
    txt.close()
 
print("输入星座:")
strList=[]
while(True):
    str=input()
    if str=='exit':
        break
    else:
        strList.append(str)
 
for str in strList:
    if str in names:
        print("{}的生日位于{}-{}之间".format(chr(eval(datas[names.index(str)][3])), datas[names.index(str)][1],datas[names.index(str)][2]))
    else:
        print("输入星座名称有误!")
 

输入:

输出:

若输入错误,得到结果为:

构造词云:

使用词云之前要用cmd命令行下载wordcloud

txt文件如下:

链接:https://pan.baidu.com/s/1y6By4u6_3nmy7PBC6POxeQ 

提取码:jo9p

代码如下:

#GovRptWordCloudv1.py
import jieba
import wordcloud
f = open("D:\\新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t) #用 jieba 库对文件内容进行中文分词,将分词结果列表赋给变量 ls
txt = " ".join(ls)#将分词结果列表 ls 中的词语用空格连接成一个字符串,并赋给变量 txt
w = wordcloud.WordCloud(   font_path = "msyh.ttc",\
    width = 1000, height = 700, background_color = "white", \
    )
w.generate(txt)#根据文本内容生成词云图像数据。
w.to_file("D:\\grwordcloud.png")#将生成的词云图像数据保存为 "grwordcloud.png" 文件

代码结果如下:

目录
相关文章
|
19天前
|
数据采集 NoSQL 关系型数据库
Python爬虫去重策略:增量爬取与历史数据比对
Python爬虫去重策略:增量爬取与历史数据比对
|
2月前
|
SQL 自然语言处理 数据库
【Azure Developer】分享两段Python代码处理表格(CSV格式)数据 : 根据每列的内容生成SQL语句
本文介绍了使用Python Pandas处理数据收集任务中格式不统一的问题。针对两种情况:服务名对应多人拥有状态(1/0表示),以及服务名与人名重复列的情况,分别采用双层for循环和字典数据结构实现数据转换,最终生成Name对应的Services列表(逗号分隔)。此方法高效解决大量数据的人工处理难题,减少错误并提升效率。文中附带代码示例及执行结果截图,便于理解和实践。
|
2月前
|
XML JSON API
淘宝商品详情API的调用流程(python请求示例以及json数据示例返回参考)
JSON数据示例:需要提供一个结构化的示例,展示商品详情可能包含的字段,如商品标题、价格、库存、描述、图片链接、卖家信息等。考虑到稳定性,示例应基于淘宝开放平台的标准响应格式。
|
1月前
|
Python
使用Python实现multipart/form-data文件接收的http服务器
至此,使用Python实现一个可以接收 'multipart/form-data' 文件的HTTP服务器的步骤就讲解完毕了。希望通过我的讲解,你可以更好地理解其中的逻辑,另外,你也可以尝试在实际项目中运用这方面的知识。
144 69
|
20天前
|
Shell 开发者 Docker
Python文件打包:一站式指南
本文深入探讨Python文件打包的各种方法,从基础的zip和tar工具到高级的setuptools、PyInstaller、cx_Freeze等,涵盖Docker镜像、虚拟环境及自包含可执行文件的打包方式。通过示例代码与详细解析,帮助开发者根据项目需求选择合适的打包方案,提升代码分发与部署效率。内容全面,适合各水平读者学习参考。
|
23天前
|
数据采集 存储 缓存
Python爬虫与代理IP:高效抓取数据的实战指南
在数据驱动的时代,网络爬虫是获取信息的重要工具。本文详解如何用Python结合代理IP抓取数据:从基础概念(爬虫原理与代理作用)到环境搭建(核心库与代理选择),再到实战步骤(单线程、多线程及Scrapy框架应用)。同时探讨反爬策略、数据处理与存储,并强调伦理与法律边界。最后分享性能优化技巧,助您高效抓取公开数据,实现技术与伦理的平衡。
57 4
|
1月前
|
存储 数据库 Python
利用Python获取网络数据的技巧
抓起你的Python魔杖,我们一起进入了网络之海,捕捉那些悠游在网络中的数据鱼,想一想不同的网络资源,是不是都像数不尽的海洋生物,我们要做的,就是像一个优秀的渔民一样,找到他们,把它们捕获,然后用他们制作出种种美味。 **1. 打开魔法之门:请求包** 要抓鱼,首先需要一个鱼网。在Python的世界里,我们就是通过所谓的“请求包”来发送“抓鱼”的请求。requests是Python中常用的发送HTTP请求的库,用它可以方便地与网络上的资源进行交互。所谓的GET,POST,DELETE,还有PUT,这些听起来像偶像歌曲一样的单词,其实就是我们鱼网的不同方式。 简单用法如下: ``` im
62 14
|
1月前
|
数据采集 搜索推荐 API
Python 原生爬虫教程:京东商品列表页面数据API
京东商品列表API是电商大数据分析的重要工具,支持开发者、商家和研究人员获取京东平台商品数据。通过关键词搜索、分类筛选、价格区间等条件,可返回多维度商品信息(如名称、价格、销量等),适用于市场调研与推荐系统开发。本文介绍其功能并提供Python请求示例。接口采用HTTP GET/POST方式,支持分页、排序等功能,满足多样化数据需求。
|
1月前
|
数据采集 存储 JSON
用Python爬虫抓取数据并保存为JSON的完整指南
用Python爬虫抓取数据并保存为JSON的完整指南
|
2月前
|
人工智能 编解码 算法
如何在Python下实现摄像头|屏幕|AI视觉算法数据的RTMP直播推送
本文详细讲解了在Python环境下使用大牛直播SDK实现RTMP推流的过程。从技术背景到代码实现,涵盖Python生态优势、AI视觉算法应用、RTMP稳定性及跨平台支持等内容。通过丰富功能如音频编码、视频编码、实时预览等,结合实际代码示例,为开发者提供完整指南。同时探讨C接口转换Python时的注意事项,包括数据类型映射、内存管理、回调函数等关键点。最终总结Python在RTMP推流与AI视觉算法结合中的重要性与前景,为行业应用带来便利与革新。
121 5