如何从xml文件创建R语言数据框dataframe

简介: 如何从xml文件创建R语言数据框dataframe

问题重现

软件:R语言

环境:windows

问题描述:我有一个XML文档文件。文件的一部分如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<List>
<SubCategory>
<ID>BO</ID>
<Name>Bookcases</Name>
</SubCategory>
<SubCategory>
<ID>CH</ID>
<Name>Chairs</Name>
</SubCategory>
<SubCategory>
<ID>LA</ID>
<Name>Labels</Name>
</SubCategory>
<SubCategory>
<ID>TA</ID>
<Name>Tables</Name>
</SubCategory>
<SubCategory>
<ID>ST</ID>
<Name>Storage</Name>
</SubCategory>
<SubCategory>
<ID>FU</ID>
<Name>Furnishings</Name>
</SubCategory>
<SubCategory>
<ID>AR</ID>
<Name>Art</Name>
</SubCategory>
<SubCategory>
<ID>PH</ID>
<Name>Phones</Name>
</SubCategory>
<SubCategory>
<ID>BI</ID>
<Name>Binders</Name>
</SubCategory>
<SubCategory>
<ID>AP</ID>
<Name>Appliances</Name>
</SubCategory>
<SubCategory>
<ID>PA</ID>
<Name>Paper</Name>
</SubCategory>
<SubCategory>
<ID>AC</ID>
<Name>Accessories</Name>
</SubCategory>
<SubCategory>
<ID>EN</ID>
<Name>Envelopes</Name>
</SubCategory>
<SubCategory>
<ID>FA</ID>
<Name>Fasteners</Name>
</SubCategory>
<SubCategory>
<ID>SU</ID>
<Name>Supplies</Name>
</SubCategory>
<SubCategory>
<ID>MA</ID>
<Name>Machines</Name>
</SubCategory>
<SubCategory>
<ID>CO</ID>
<Name>Copiers</Name>
</SubCategory>
</List>

从这个XML文件中,我想创建一个具有ID,name 列的R数据框。请注意,name和ID应包含变量的所有级别。

解决方案

假设这是正确的taxlots.shp.xml文件:



<?xml version="1.0" encoding="UTF-8"?>
<List>
<SubCategory>
<ID>BO</ID>
<Name>Bookcases</Name>
</SubCategory>
<SubCategory>
<ID>CH</ID>
<Name>Chairs</Name>
</SubCategory>
<SubCategory>
<ID>LA</ID>
<Name>Labels</Name>
</SubCategory>
<SubCategory>
<ID>TA</ID>
<Name>Tables</Name>
</SubCategory>
<SubCategory>
<ID>ST</ID>
<Name>Storage</Name>
</SubCategory>
<SubCategory>
<ID>FU</ID>
<Name>Furnishings</Name>
</SubCategory>
<SubCategory>
<ID>AR</ID>
<Name>Art</Name>
</SubCategory>
<SubCategory>
<ID>PH</ID>
<Name>Phones</Name>
</SubCategory>
<SubCategory>
<ID>BI</ID>
<Name>Binders</Name>
</SubCategory>
<SubCategory>
<ID>AP</ID>
<Name>Appliances</Name>
</SubCategory>
<SubCategory>
<ID>PA</ID>
<Name>Paper</Name>
</SubCategory>
<SubCategory>
<ID>AC</ID>
<Name>Accessories</Name>
</SubCategory>
<SubCategory>
<ID>EN</ID>
<Name>Envelopes</Name>
</SubCategory>
<SubCategory>
<ID>FA</ID>
<Name>Fasteners</Name>
</SubCategory>
<SubCategory>
<ID>SU</ID>
<Name>Supplies</Name>
</SubCategory>
<SubCategory>
<ID>MA</ID>
<Name>Machines</Name>
</SubCategory>
<SubCategory>
<ID>CO</ID>
<Name>Copiers</Name>
</SubCategory

XML格式的数据很少以允许该xmlToDataFrame功能正常工作的方式进行组织。最好提取列表中的所有内容,然后将列表绑定到数据框中:



 
data <- xmlParse("ProductSubcategory.xml")


xml_data <- xmlToList(data)


dataDictionary <- xmlToDataFrame(getNodeSet(data,"//SubCategory"))

相关文章
|
4月前
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
108 1
|
6月前
|
XML Java 数据格式
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
这篇文章是Spring5框架的实战教程,主要介绍了如何在Spring的IOC容器中通过XML配置方式使用外部属性文件来管理Bean,特别是数据库连接池的配置。文章详细讲解了创建属性文件、引入属性文件到Spring配置、以及如何使用属性占位符来引用属性文件中的值。
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
|
3月前
|
XML Android开发 数据格式
Eclipse 创建 XML 文件
Eclipse 创建 XML 文件
47 2
|
3月前
|
Java Maven
maven项目的pom.xml文件常用标签使用介绍
第四届人文,智慧教育与服务管理国际学术会议(HWESM 2025) 2025 4th International Conference on Humanities, Wisdom Education and Service Management
278 8
|
8月前
|
XML Java 数据格式
java创建xml文件内容
java创建xml文件内容
|
8月前
|
XML Java 数据格式
java解析xml文件内容
java解析xml文件内容
|
4月前
|
XML JavaScript Java
java与XML文件的读写
java与XML文件的读写
46 3
|
5月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
4月前
|
XML 存储 缓存
C#使用XML文件的详解及示例
C#使用XML文件的详解及示例
191 0
|
4月前
|
XML 存储 Web App开发
查看 XML 文件
查看 XML 文件