XML

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
日志服务 SLS,月写入数据量 50GB 1个月
简介: XML是eXtensible Markup Language的缩写,中文含义为“可扩展标记语言”。后缀名为”.xml”,具有不同系统平台间的信息互通、整合多种不同数据源的数据、更精确的数据检索 、平衡客户端和服务器端的处理负荷 等特点。

相关历史

由于HTML标签具有很多样式的’杂质’信息,语法松散,原本想以XML想替换掉HTML但最终因HTML应用广泛而替换失败。所以把HTML按照XML标准,推出了XHTML版本,XHTML相对HTML语法严格。XML与HTML具有以下区别

  • xml语法严格
  • 显示/数据 分离 :HTML标签带有样式
  • 标签自描述性 :h1,p,a …标签是HTML标准规定好的,xml的是自定义的

基础语法

XML的语法相对HTML的语法更严格,如果错误则无法运行。如 漏结束标签、开始标签与结束标签大小不一致。必须遵守以下XML编写规范

  • 整个文档有且只有一个跟节点。
  • 元素必须被正确地嵌套。
  • 每个元素必须同时拥有起始标签和结束标签。
  • 元素必须成对实现(单标签除外),且闭合。
  • 开始结束元素名称必须保持一致包括大小写。建议使用全小写
  • 元素可以在开始标签处自定义属性给元素提供信息
<!-- xml 版本声明 -->
<?xml version="1.0" encoding="UTF-8"?>
<test>
    <title>今天学习XML</title>
    <content>
        <a>基础语法</a>
        <b>解析与生成</b>

        <!-- CDATA定界符的内容不会被解析, 按照源代码输出 -->
        <c><![CDATA[&lt; &gt;]]></c>
    </content>
</test>

PHP生成XML的方式

使用纯粹的PHP代码生成字符串

//php字符串拼接生成字符串:
header('Content-Type:text/xml;charset=utf-8');
$books = array( array( 'title' => 'php', 'author' => 'php', ));
$str=null;
$str= '<?xml version="1.0" encoding="utf-8" ?>'. "\n";
$str.= "<books>\n";
foreach($books as $book){
    $str.= "<book>\n";
    foreach($book as $tag=>$data){
        $str.= "<$tag>".htmlspecialchars($data)."</$tag>\n";
    }
    $str.= "</book>\n";
}
$str.= "</books>\n";
echo $str;

使用DomDocument生成XML文件

Document 对象是一棵文档树的根,代表整个HTML或XML文档。提供对文档数据的最初(或最顶层)的访问入口。提供了创建元素(标签)对象的方法。Node 对象提供了一个 ownerDocument 属性,此属性可把它们与在其中创建它们的 Document 关联起来。在创建xml与解析顺序倒换,即 文本内容——>属性与值——>普通元素节点——>根节点

header("Content-Type:text/html;charset=utf-8");
#创建DOM对象
$dom=new DOMDocument('1.0','utf-8');
#创建文本节点
$text=$dom->createTextNode('2015.10.17学习XML');    
#创建普通节点
$title=$dom->createElement('title');
#把内容添加到节点中
$title->appendChild($text);
#创建属性
$title->setAttribute('test','tit');
#创建CDATA节点
$cdata=$dom->createCDATASection('XML文档');

#创建文本节点
$text=$dom->createTextNode('基础语法');  
#创建普通节点
$a=$dom->createElement('a');
#把内容添加到节点中
$a->appendChild($text);

#创建'解析与生成'文本节点
$text=$dom->createTextNode('解析与生成');  
#创建b节点
$b=$dom->createElement('b');
#把text  添加到b节点
$b->appendChild($text);

#创建c节点
$c=$dom->createElement('c');
#把cdata  添加到c节点
$c->appendChild($cdata);

#创建 content节点
$content=$dom->createElement('content');
#把 a、b c节点添加到content节点
$content->appendChild($a);
$content->appendChild($b);
$content->appendChild($c);

#创建test节点
$test=$dom->createElement('test');
#把title、content节点 添加到test节点 
$test->appendChild($title);
$test->appendChild($content);
#把test节点添加到xml文档
$dom->appendChild($test);
#直接页面输出
header('content-type:text/xml');
echo $dom->saveXML();
#echo $dom->save('test.xml')? 'ok':'false';

#删除c节点
$dom->load('./test.xml');
$c=$dom->getElementsByTagName('c')->item(0);
echo "<pre>";
print_r($c);
$c->parentNode->removeChild($c);
header('content-type:text/xml');
echo $dom->saveXML();

#修改title节点,本质是创建一个同名节点与不同内容进行替换
$dom->load('./test.xml');
$title=$dom->getElementsByTagName('title')->item(0);
$cont=$dom->createTextNode('修改');
$title->replaceChild($cont,$title->firstChild);
header('content-type:text/xml');
echo $dom->saveXML();

以上代码生成以下xml文件

<?xml version="1.0" encoding="UTF-8"?>
<test>
    <title test='tit'>2015.10.17学习XML</title>
    <content>
        <a>基础语法</a>
        <b>解析与生成</b>
        <c><![CDATA[XML文档]]></c>
    </content>
    <title>2015.10.18学习JSON</title>
    <content test='con'>
        <a>基础语法</a>
        <b>解析与生成</b>
        <c><![CDATA[JSON文档]]></c>
    </content>
</test>

案例应用

API开发

从数据库读取数据并生成xml格式

RSS订阅

RSS(Really Simple Syndication-简易供稿),是一种网页内容联合格式。RSS是XML的一种。所有的RSS文档都遵循XML 1.0规范,是使用最广泛的XML应用。

RSS目前广泛用于网上新闻频道、blog和wiki,主要的版本有0.91, 1.0, 2.0。使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。

<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0" >
<channel>
    <title>标题></title>
    <link>链接地址</link>
    <description>描述</description>
    <language>描述语言</language>
    <copyright>版本</copyright>
    <pubDate>21 Oct 2008 01:43:15 GMT</pubDate>
    <item>
    <title>日志的标题</title>
    <link>日志的URL访问地址</link>
    <author>日志的作者</author>
    <pubDate>日志的发布日期</pubDate>
    <description>日志的内容</description>
    </item>
</channel>
</rss>

使用XMLWriter类创建XML文件

使用SimpleXML创建XML文档

header("Content-Type:text/html;charset=utf-8");
$arr=array(
    'name'=>'小明',
    'sex'=>'男',
    'age'=>18,
    'job'=>array(
        'title' =>'技术经理' ,
        'salary' =>10000 ,
        'team' =>array('小米','小淘','小京')
     )   
);


function arrXML($arr,$node=null){
    if($node===null){
        $simple=new SimpleXMLElement('<?xml version="1.0" encoding="utf-8"?><base></base>');
    }else{
        $simple=$node;
    }

    foreach ($arr as $k => $v) {
        if(is_array($v)){
            $simpl=$simple->addChild($k);
            arrXML($v,$simpl);
        }elseif(is_numeric($k)){
            $simple->addChild('item'.$k,$v);
        }else{
            $simple->addChild($k,$v);
        }
    }
    header('Content-Type:text/xml;charset=utf-8');
    return $simple->saveXML();

}

echo arrXML($arr);

php解析xml的方式

XML 是一种严格的文档格式,在解析XML时,需要遵循DOM标准,无论是PHP、JAVA、C、js解析DOM,都同样遵循DOM标准。
所有现代浏览器都内建了供读取和操作 XML 的 XML 解析器。解析器把 XML 转换为 XML DOM 对象 - 可通过 JavaScript 操作的对象。微软的解析器支持 XML 文件和 XML 字符串(文本)的加载,而其他浏览器使用单独的解析器。不过,所有的解析器都包含遍历 XML 树、访问插入及删除节点(元素)及其属性的函数。

先建立一个xml文档

<?xml version="1.0" encoding="utf-8"?>
<books>
    <book>
        <title>php</title>
        <author>test1</author>
    </book>
    <book>
        <title>javascript</title>
        <author>test2</author>
    </book>
</books>

使用DOMDocument类解析XML

header("Content-Type:text/html;charset=utf-8");
#创建DOM解析对象 ,
#功能 :  把xml文件载入内存并分析,则此时可以利用DOM obj 分析xml
$dom=new DOMDocument('1.0','utf-8');

#载入xml文档
$dom->load('./test.xml');
#获取节点列表,因为可能会存在多个相同的xml标签 ,故得到的是列表  DOMNodeList Object 

$list=$dom->getElementsByTagName('title');

#DOMNodeList Object  有一个属性 length 获取节点数量,一个方法 item(n) 获取第n个节点
echo $list->length;
echo "<pre>";
$elements=$list->item(0);   //返回  列表  DOMElement Object

echo $elements->nodeValue;   //php 

XMLReader解析xml

//利用XMLReader解析xml
header('Content-Type:text/html;charset=utf-8');
$xml=new XMLReader();
$xml->open('test.xml');
$i=0;$arr=array();
while($xml->read()){
   if($xml->name=='title'){
      $xml->read();
      $arr[$i]['title']=$xml->value;
      $xml->read();
   }
   if($xml->name=='author'){
        $xml->read();
        $arr[$i]['temp']=$xml->value;
        $xml->read();
        $i++;
   }
}
echo "<pre>";
print_r($arr);

SimpleXMLElement解析xml

SimpleXMLElement解析xml非常简单,一次性把XML文档解析成一个多维对象(即包含了数组和子对象),但数组对象混合导致数据结构容易混淆。需要把它转为数组类型,参考以下分析思路

  • 先把最外层对象转成数组,再循环数组,即类型强制转换 (array) $obj
  • 若数组元素还是对象或数组,则继续调用自身函数来转换(递归思想)
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
XML 存储 Web App开发
查看 XML 文件
查看 XML 文件
|
3月前
|
XML 存储 JavaScript
xml介绍与解析,及xml库包使用
xml介绍与解析,及xml库包使用
34 0
|
3月前
|
XML 存储 数据库
什么是 XML?
【8月更文挑战第22天】
39 0
|
6月前
|
XML 数据格式
|
XML Java 区块链
为什么需要用xml
为什么需要用xml
|
XML JSON JavaScript
了解xml
即使在xml被json'替代的今天,你也应该了解它。
166 0
|
XML 存储 PHP
XML简单基础详解(I)
学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。各位小伙伴,如果您:
107 0
XML简单基础详解(I)
|
XML 存储 数据处理
xml
xml
100 0
|
XML JavaScript Java
XML就是这么简单
什么是XML? XML:extensiable markup language 被称作可扩展标记语言 XML简单的历史介绍: gml->sgml->html->xml gml(通用标记语言)–在不同的机器进行通信的数据规范 sgml(标准通用标记语言) html(超文本标记语言) 为什么我们需要...
1277 0
|
Web App开发 JavaScript 数据格式