Python编程:xlm文件读写

简介: Python编程:xlm文件读写

xml文件增删改查


先引入解析xml文档的模块

import xml.etree.ElementTree as ET
tree = ET.parse("data.xml")  # 解析文档
root = tree.getroot()  # 获取根节点
print(root)
print(root.tag)

读取

# 遍历文档
for child in root:
    print(child.tag, child.attrib)
    for i in child:
        print(i.tag, i.attrib, i.text)
# 只遍历year节点
for nood in root.iter("year"):
     print(nood.tag, nood.text)

修改

for node in root.iter("year"):
    new_year = int(node.text) + 1
    node.text = str(new_year)
    node.set("update_by", "Tom")
tree.write("data.xml") # 修改后需要保存

删除

for country in root.findall("country"):
    rank = int(country.find("rank").text)
    if rank >50:
        root.remove(country)
tree.write("data.xml")  # 修改后需要保存

创建

new_xml = ET.Element("personlist")
person = ET.SubElement(new_xml, "person", attrib={"enrolled": "yes"})
name1 = ET.SubElement(person, "name")
name1.text = "Tom"
age = ET.SubElement(person, "age", attrib={"checked": "no"})
age.text = "33"
sex = ET.SubElement(person, "sex")
sex.text = 'man'
person2 = ET.SubElement(new_xml, "person", attrib={"enrolled": "no"})
name2 = ET.SubElement(person2, "name")
name2.text = "Jimi"
age2 = ET.SubElement(person2, "age")
age2.text = '19'
sex2 = ET.SubElement(person2, "sex")
sex2.text = "women"
et = ET.ElementTree(new_xml)  # 生成文档对象
et.write("test.xml", encoding="utf-8", xml_declaration=True)  # 写入文件
ET.dump(new_xml)  # 打印生成的格式

help(ET)

"""
Each Element has a number of properties associated with it:
       'tag' - a string containing the element's name.
       'attrib' - a Python dictionary storing the element's attributes.
       'text' - a string containing the element's text content.
       'tail' - an optional string containing text after the element's end tag.
    class Element(builtins.object)
     |  
     |  append(...)
     |  
     |  clear(...)
     |  
     |  extend(...)
     |  
     |  find(...)
     |  
     |  findall(...)
     |  
     |  findtext(...)
     |  
     |  get(...)
     |  
     |  getchildren(...)
     |  
     |  getiterator(...)
     |  
     |  insert(...)
     |  
     |  items(...)
     |  
     |  iter(...)
     |  
     |  iterfind(...)
     |  
     |  itertext(...)
     |  
     |  keys(...)
     |  
     |  makeelement(...)
     |  
     |  remove(...)
     |  
     |  set(...)
    class ElementTree(builtins.object)
     |  
     |  Methods defined here:
     |  
     |  __init__(self, element=None, file=None)
     |  
     |  find(self, path, namespaces=None)
     |      Find first matching element by tag name or path.
     |      Return the first matching element, or None if no element was found.
     |  
     |  findall(self, path, namespaces=None)
     |      Find all matching subelements by tag name or path.
     |      Return list containing all matching elements in document order.
     |  
     |  findtext(self, path, default=None, namespaces=None)
     |      Find first matching element by tag name or path.
     |      Return the first matching element, or None if no element was found.
     |  
     |  getiterator(self, tag=None)
     |      # compatibility
     |  
     |  getroot(self)
     |      Return root element of this tree.
     |  
     |  iter(self, tag=None)
     |      Create and return tree iterator for the root element.
     |  
     |  iterfind(self, path, namespaces=None)
     |      Find all matching subelements by tag name or path.
     |      Return an iterable yielding all matching elements in document order.
     |  
     |  parse(self, source, parser=None)
     |      Load external XML document into element tree.
     |      Returns the root element of the given source document.
     |  
     |  write(self, file_or_filename, encoding=None, xml_declaration=None, default_namespace=None, method=None, *, short_empty_elements=True)
     |      Write element tree to a file as XML.
     |  ----------------------------------------------------------------------
FUNCTIONS
    Comment(text=None)
        Comment element factory.
    PI = ProcessingInstruction(target, text=None)
        Processing Instruction element factory.
    ProcessingInstruction(target, text=None)
        Processing Instruction element factory.
    SubElement(...)
    XML(text, parser=None)
        Parse XML document from string constant.
        Returns an Element instance.
    XMLID(text, parser=None)
        Parse XML document from string constant for its IDs      
        Returns an (Element, dict) tuple, in which the
        dict maps element id:s to elements.
    dump(elem)
        Write element tree or element structure to sys.stdout.
    fromstring = XML(text, parser=None)
        Parse XML document from string constant.
        Returns an Element instance.
    fromstringlist(sequence, parser=None)
        Parse XML document from sequence of string fragments.
        Returns an Element instance.
    iselement(element)
        Return True if *element* appears to be an Element.
    iterparse(source, events=None, parser=None)
        Incrementally parse XML document into ElementTree.
        Returns an iterator providing (event, elem) pairs.
    parse(source, parser=None)
        Parse XML document into element tree.
        Return an ElementTree instance.
    register_namespace(prefix, uri)
        Register a namespace prefix.
    tostring(element, encoding=None, method=None, *, short_empty_elements=True)
        Generate string representation of XML element.     
        Returns an (optionally) encoded string containing the XML data.
    tostringlist(element, encoding=None, method=None, *, short_empty_elements=True)
"""
相关文章
|
2月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
2月前
|
编译器 Python
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
|
3月前
|
Python
Python编程基石:整型、浮点、字符串与布尔值完全解读
本文介绍了Python中的四种基本数据类型:整型(int)、浮点型(float)、字符串(str)和布尔型(bool)。整型表示无大小限制的整数,支持各类运算;浮点型遵循IEEE 754标准,需注意精度问题;字符串是不可变序列,支持多种操作与方法;布尔型仅有True和False两个值,可与其他类型转换。掌握这些类型及其转换规则是Python编程的基础。
207 33
|
2月前
|
数据采集 分布式计算 大数据
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
78 1
|
3月前
|
编解码 Prometheus Java
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
65 4
|
3月前
|
人工智能 索引 Python
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
91 5
|
2月前
|
数据采集 监控 算法
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
74 0
|
3月前
|
设计模式 安全 Python
Python编程精进:正则表达式
正则表达式是一种强大的文本处理工具,用于搜索、匹配和提取模式。本文介绍了正则表达式的语法基础,如`\d`、`\w`等符号,并通过实例展示其在匹配电子邮件、验证电话号码、处理日期格式等场景中的应用。同时,文章提醒用户注意性能、编码、安全性等问题,避免常见错误,如特殊字符转义不当、量词使用错误等。掌握正则表达式能显著提升文本处理效率,但需结合实际需求谨慎设计模式。
134 2
|
3月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
|
3月前
|
数据采集 运维 BI
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!

推荐镜像

更多