我想使用一种我熟悉的语言-Java,C#,Ruby,PHP,C / C ++,尽管非常欢迎使用任何语言或伪代码的示例。
将大型XML文档拆分为仍然有效的较小部分的最佳方法是什么?出于我的目的,我需要将它们拆分为大约三分之四或四分之一,但是为了提供示例,将它们拆分为n个组件将是很好的。
当然,您总是可以提取顶级元素(这是否取决于您的粒度)。在C#中,您将使用XmlDocument类。例如,如果您的XML文件如下所示:
<Document>
<Piece>
Some text
</Piece>
<Piece>
Some other text
</Piece>
</Document>
那么您将使用如下代码提取所有片段:
XmlDocument doc = new XmlDocument();
doc.Load("<path to xml file>");
XmlNodeList nl = doc.GetElementsByTagName("Piece");
foreach (XmlNode n in nl)
{
// Do something with each Piece node
}
一旦有了节点,就可以在代码中对它们进行处理,或者可以将节点的整个文本传输到其自己的XML文档中,并像对待独立的XML一样对其进行操作(包括保存它)。回到磁盘等)。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。