使用Dom生成xml文件和解析xml文件

简介: xml这种文件格式在很多时候都是很适合我们用来存取数据的,所以利用程序来生成xml文件和解析xml文件就显得比较重要了。在dom中是把每一个元素都看做是一个节点Node的,所有页面上的属性、元素等都是继承自Node的,所以当获取到的是一个Node,而你知道它实际的类型并需要使用的时候就可能会需要进行类型转换了。

xml这种文件格式在很多时候都是很适合我们用来存取数据的,所以利用程序来生成xml文件和解析xml文件就显得比较重要了。在dom中是把每一个元素都看做是一个节点Node的,所有页面上的属性、元素等都是继承自Node的,所以当获取到的是一个Node,而你知道它实际的类型并需要使用的时候就可能会需要进行类型转换了。

Element root = document.getDocumentElement();//获取根节点

下面是代码:

 

生成xml:

public void geneXmlByDom() throws Exception {
		//step1:获得一个DocumentBuilderFactory
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		//step2:获得一个DocumentBuilder
		DocumentBuilder db = factory.newDocumentBuilder();
		//step3:新建一个Document对象
		Document document = db.newDocument();
		//step4:创建一个根节点
		Element rootElement = document.createElement("Persons");
		for (int i=0;i<5;i++) {
			//step5:创建一个节点
			Element person = document.createElement("person");
			//step6:为该节点设定属性
			person.setAttribute("id", "id_"+i);
			Element name = document.createElement("name");
			//为节点设定文本内容
			name.setTextContent("name_"+i);
			Element address = document.createElement("address");
			address.setTextContent("address_"+i);
			Element email = document.createElement("email");
			email.setTextContent("email_"+i);
			person.appendChild(name);
			person.appendChild(address);
			person.appendChild(email);
			//step7:为某一元素节点设立子节点
			rootElement.appendChild(person);
		}
		//step8:把刚刚建立的根节点添加到document对象中
		document.appendChild(rootElement);
		//step9:获得一个TransformerFactory对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		//step10:获得一个Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		//step11:把document对象用一个DOMSource对象包装起来
		Source xmlSource = new DOMSource(document);
		//step12:建立一个存储目标对象
		Result outputTarget = new StreamResult(new File("persons.xml"));
		//step13:生成相应的xml文件
		transformer.transform(xmlSource, outputTarget);
	}

 

 生成的xml文件是这个样子

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<Persons>
	<person id="id_0">
		<name>name_0</name>
		<address>address_0</address>
		<email>email_0</email>
	</person>
	<person id="id_1">
		<name>name_1</name>
		<address>address_1</address>
		<email>email_1</email>
	</person>
	<person id="id_2">
		<name>name_2</name>
		<address>address_2</address>
		<email>email_2</email>
	</person>
	<person id="id_3">
		<name>name_3</name>
		<address>address_3</address>
		<email>email_3</email>
	</person>
	<person id="id_4">
		<name>name_4</name>
		<address>address_4</address>
		<email>email_4</email>
	</person>
</Persons>

 

在进行输出写到文件的时候可以设置一些Transformer输出的参数,如xml的编码,或者输出形式等。

		transformer.setOutputProperty("encoding", "UTF-8");//设定文档编码,属性也可以使用OutputKeys的静态常量属性设定
		transformer.setOutputProperty(OutputKeys.METHOD, "xml");//输出方式,可以是xml、html和text

 

 

下面的解析也是基于这个文件的。

 

解析xml:

public void parseXmlByDom() throws Exception {
		//step1:获得DocumentBuilderFactory
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		//step2:获得DocumentBuilder
		DocumentBuilder db = factory.newDocumentBuilder();
		//step3:把需要解析的xml文件加载到一个document对象中
		Document document = db.parse("persons.xml");
		//获取所有名称为person的元素
		NodeList nodeList = document.getElementsByTagName("person");
		for (int i=0;i<nodeList.getLength();i++) {
			//因为这里我知道它就是一个Element对象,所以进行了强转
			Element person = (Element)nodeList.item(i);
			//获得Element对象的属性
			String id = person.getAttribute("id");
			//因为这里我知道只有一个对象,所以就直接item(0)了,
			//因为Dom是把每个对象都看做是一个节点的,所以如果在item(0)的时候直接取getNodeValue()是取不到值的,
			//只有是TextNode的时候用那个方法才可以取到值,如果想直接取值就用getTextContent()
			String name = person.getElementsByTagName("name").item(0).getTextContent();
			String address = person.getElementsByTagName("address").item(0).getTextContent();
			String email = person.getElementsByTagName("email").item(0).getTextContent();
			System.out.println(" id = "+id+" \r\n name = "+name+" \r\n address = "+address+" \r\n email = "+email);
			System.out.println("-------------------------------------");
		}
		
	}

 解析后输出的结果:

 id = id_0 
 name = name_0 
 address = address_0 
 email = email_0
-------------------------------------
 id = id_1 
 name = name_1 
 address = address_1 
 email = email_1
-------------------------------------
 id = id_2 
 name = name_2 
 address = address_2 
 email = email_2
-------------------------------------
 id = id_3 
 name = name_3 
 address = address_3 
 email = email_3
-------------------------------------
 id = id_4 
 name = name_4 
 address = address_4 
 email = email_4
-------------------------------------

 

目录
相关文章
|
2月前
|
XML 数据采集 API
用Lxml高效解析XML格式数据:以天气API为例
免费Python教程:实战解析中国天气网XML数据,详解Lxml库高效解析技巧、XPath用法、流式处理大文件及IP封禁应对策略,助你构建稳定数据采集系统。
211 0
|
9月前
|
存储 Java 文件存储
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— logback.xml 配置文件解析
本文解析了 `logback.xml` 配置文件的详细内容,包括日志输出格式、存储路径、控制台输出及日志级别等关键配置。通过定义 `LOG_PATTERN` 和 `FILE_PATH`,设置日志格式与存储路径;利用 `&lt;appender&gt;` 节点配置控制台和文件输出,支持日志滚动策略(如文件大小限制和保存时长);最后通过 `&lt;logger&gt;` 和 `&lt;root&gt;` 定义日志级别与输出方式。此配置适用于精细化管理日志输出,满足不同场景需求。
2231 1
|
7月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
289 13
用深度学习提升DOM解析——自动提取页面关键区块
|
7月前
|
Android开发 开发者
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
本文详细介绍了如何通过自定义 `attrs.xml` 文件实现 Android 自定义 View 的属性配置。以一个包含 TextView 和 ImageView 的 DemoView 为例,讲解了如何使用自定义属性动态改变文字内容和控制图片显示隐藏。同时,通过设置布尔值和点击事件,实现了图片状态的切换功能。代码中展示了如何在构造函数中解析自定义属性,并通过方法 `setSetting0n` 和 `setbackeguang` 实现功能逻辑的优化与封装。此示例帮助开发者更好地理解自定义 View 的开发流程与 attrs.xml 的实际应用。
216 2
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
|
12月前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
2801 65
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
9月前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
343 15
|
8月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
224 0
|
10月前
|
Java API 数据处理
深潜数据海洋:Java文件读写全面解析与实战指南
通过本文的详细解析与实战示例,您可以系统地掌握Java中各种文件读写操作,从基本的读写到高效的NIO操作,再到文件复制、移动和删除。希望这些内容能够帮助您在实际项目中处理文件数据,提高开发效率和代码质量。
270 4
|
11月前
|
Serverless 对象存储 人工智能
智能文件解析:体验阿里云多模态信息提取解决方案
在当今数据驱动的时代,信息的获取和处理效率直接影响着企业决策的速度和质量。然而,面对日益多样化的文件格式(文本、图像、音频、视频),传统的处理方法显然已经无法满足需求。
456 4
智能文件解析:体验阿里云多模态信息提取解决方案
|
消息中间件 存储 Java
RocketMQ文件刷盘机制深度解析与Java模拟实现
【11月更文挑战第22天】在现代分布式系统中,消息队列(Message Queue, MQ)作为一种重要的中间件,扮演着连接不同服务、实现异步通信和消息解耦的关键角色。Apache RocketMQ作为一款高性能的分布式消息中间件,广泛应用于实时数据流处理、日志流处理等场景。为了保证消息的可靠性,RocketMQ引入了一种称为“刷盘”的机制,将消息从内存写入到磁盘中,确保消息持久化。本文将从底层原理、业务场景、概念、功能点等方面深入解析RocketMQ的文件刷盘机制,并使用Java模拟实现类似的功能。
344 3

推荐镜像

更多
  • DNS