相关历史
由于HTML标签具有很多样式的’杂质’信息,语法松散,原本想以XML想替换掉HTML但最终因HTML应用广泛而替换失败。所以把HTML按照XML标准,推出了XHTML版本,XHTML相对HTML语法严格。XML与HTML具有以下区别
- xml语法严格
- 显示/数据 分离 :HTML标签带有样式
- 标签自描述性 :h1,p,a …标签是HTML标准规定好的,xml的是自定义的
基础语法
XML的语法相对HTML的语法更严格,如果错误则无法运行。如 漏结束标签、开始标签与结束标签大小不一致。必须遵守以下XML编写规范
- 整个文档有且只有一个跟节点。
- 元素必须被正确地嵌套。
- 每个元素必须同时拥有起始标签和结束标签。
- 元素必须成对实现(单标签除外),且闭合。
- 开始结束元素名称必须保持一致包括大小写。建议使用全小写
- 元素可以在开始标签处自定义属性给元素提供信息
<!-- xml 版本声明 -->
<?xml version="1.0" encoding="UTF-8"?>
<test>
<title>今天学习XML</title>
<content>
<a>基础语法</a>
<b>解析与生成</b>
<!-- CDATA定界符的内容不会被解析, 按照源代码输出 -->
<c><![CDATA[< >]]></c>
</content>
</test>
PHP生成XML的方式
使用纯粹的PHP代码生成字符串
//php字符串拼接生成字符串:
header('Content-Type:text/xml;charset=utf-8');
$books = array( array( 'title' => 'php', 'author' => 'php', ));
$str=null;
$str= '<?xml version="1.0" encoding="utf-8" ?>'. "\n";
$str.= "<books>\n";
foreach($books as $book){
$str.= "<book>\n";
foreach($book as $tag=>$data){
$str.= "<$tag>".htmlspecialchars($data)."</$tag>\n";
}
$str.= "</book>\n";
}
$str.= "</books>\n";
echo $str;
使用DomDocument生成XML文件
Document 对象是一棵文档树的根,代表整个HTML或XML文档。提供对文档数据的最初(或最顶层)的访问入口。提供了创建元素(标签)对象的方法。Node 对象提供了一个 ownerDocument 属性,此属性可把它们与在其中创建它们的 Document 关联起来。在创建xml与解析顺序倒换,即 文本内容——>属性与值——>普通元素节点——>根节点
header("Content-Type:text/html;charset=utf-8");
#创建DOM对象
$dom=new DOMDocument('1.0','utf-8');
#创建文本节点
$text=$dom->createTextNode('2015.10.17学习XML');
#创建普通节点
$title=$dom->createElement('title');
#把内容添加到节点中
$title->appendChild($text);
#创建属性
$title->setAttribute('test','tit');
#创建CDATA节点
$cdata=$dom->createCDATASection('XML文档');
#创建文本节点
$text=$dom->createTextNode('基础语法');
#创建普通节点
$a=$dom->createElement('a');
#把内容添加到节点中
$a->appendChild($text);
#创建'解析与生成'文本节点
$text=$dom->createTextNode('解析与生成');
#创建b节点
$b=$dom->createElement('b');
#把text 添加到b节点
$b->appendChild($text);
#创建c节点
$c=$dom->createElement('c');
#把cdata 添加到c节点
$c->appendChild($cdata);
#创建 content节点
$content=$dom->createElement('content');
#把 a、b c节点添加到content节点
$content->appendChild($a);
$content->appendChild($b);
$content->appendChild($c);
#创建test节点
$test=$dom->createElement('test');
#把title、content节点 添加到test节点
$test->appendChild($title);
$test->appendChild($content);
#把test节点添加到xml文档
$dom->appendChild($test);
#直接页面输出
header('content-type:text/xml');
echo $dom->saveXML();
#echo $dom->save('test.xml')? 'ok':'false';
#删除c节点
$dom->load('./test.xml');
$c=$dom->getElementsByTagName('c')->item(0);
echo "<pre>";
print_r($c);
$c->parentNode->removeChild($c);
header('content-type:text/xml');
echo $dom->saveXML();
#修改title节点,本质是创建一个同名节点与不同内容进行替换
$dom->load('./test.xml');
$title=$dom->getElementsByTagName('title')->item(0);
$cont=$dom->createTextNode('修改');
$title->replaceChild($cont,$title->firstChild);
header('content-type:text/xml');
echo $dom->saveXML();
以上代码生成以下xml文件
<?xml version="1.0" encoding="UTF-8"?>
<test>
<title test='tit'>2015.10.17学习XML</title>
<content>
<a>基础语法</a>
<b>解析与生成</b>
<c><![CDATA[XML文档]]></c>
</content>
<title>2015.10.18学习JSON</title>
<content test='con'>
<a>基础语法</a>
<b>解析与生成</b>
<c><![CDATA[JSON文档]]></c>
</content>
</test>
案例应用
API开发
从数据库读取数据并生成xml格式
RSS订阅
RSS(Really Simple Syndication-简易供稿),是一种网页内容联合格式。RSS是XML的一种。所有的RSS文档都遵循XML 1.0规范,是使用最广泛的XML应用。
RSS目前广泛用于网上新闻频道、blog和wiki,主要的版本有0.91, 1.0, 2.0。使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。
<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0" >
<channel>
<title>标题></title>
<link>链接地址</link>
<description>描述</description>
<language>描述语言</language>
<copyright>版本</copyright>
<pubDate>21 Oct 2008 01:43:15 GMT</pubDate>
<item>
<title>日志的标题</title>
<link>日志的URL访问地址</link>
<author>日志的作者</author>
<pubDate>日志的发布日期</pubDate>
<description>日志的内容</description>
</item>
</channel>
</rss>
使用XMLWriter类创建XML文件
使用SimpleXML创建XML文档
header("Content-Type:text/html;charset=utf-8");
$arr=array(
'name'=>'小明',
'sex'=>'男',
'age'=>18,
'job'=>array(
'title' =>'技术经理' ,
'salary' =>10000 ,
'team' =>array('小米','小淘','小京')
)
);
function arrXML($arr,$node=null){
if($node===null){
$simple=new SimpleXMLElement('<?xml version="1.0" encoding="utf-8"?><base></base>');
}else{
$simple=$node;
}
foreach ($arr as $k => $v) {
if(is_array($v)){
$simpl=$simple->addChild($k);
arrXML($v,$simpl);
}elseif(is_numeric($k)){
$simple->addChild('item'.$k,$v);
}else{
$simple->addChild($k,$v);
}
}
header('Content-Type:text/xml;charset=utf-8');
return $simple->saveXML();
}
echo arrXML($arr);
php解析xml的方式
XML 是一种严格的文档格式,在解析XML时,需要遵循DOM标准,无论是PHP、JAVA、C、js解析DOM,都同样遵循DOM标准。
所有现代浏览器都内建了供读取和操作 XML 的 XML 解析器。解析器把 XML 转换为 XML DOM 对象 - 可通过 JavaScript 操作的对象。微软的解析器支持 XML 文件和 XML 字符串(文本)的加载,而其他浏览器使用单独的解析器。不过,所有的解析器都包含遍历 XML 树、访问插入及删除节点(元素)及其属性的函数。
先建立一个xml文档
<?xml version="1.0" encoding="utf-8"?>
<books>
<book>
<title>php</title>
<author>test1</author>
</book>
<book>
<title>javascript</title>
<author>test2</author>
</book>
</books>
使用DOMDocument类解析XML
header("Content-Type:text/html;charset=utf-8");
#创建DOM解析对象 ,
#功能 : 把xml文件载入内存并分析,则此时可以利用DOM obj 分析xml
$dom=new DOMDocument('1.0','utf-8');
#载入xml文档
$dom->load('./test.xml');
#获取节点列表,因为可能会存在多个相同的xml标签 ,故得到的是列表 DOMNodeList Object
$list=$dom->getElementsByTagName('title');
#DOMNodeList Object 有一个属性 length 获取节点数量,一个方法 item(n) 获取第n个节点
echo $list->length;
echo "<pre>";
$elements=$list->item(0); //返回 列表 DOMElement Object
echo $elements->nodeValue; //php
XMLReader解析xml
//利用XMLReader解析xml
header('Content-Type:text/html;charset=utf-8');
$xml=new XMLReader();
$xml->open('test.xml');
$i=0;$arr=array();
while($xml->read()){
if($xml->name=='title'){
$xml->read();
$arr[$i]['title']=$xml->value;
$xml->read();
}
if($xml->name=='author'){
$xml->read();
$arr[$i]['temp']=$xml->value;
$xml->read();
$i++;
}
}
echo "<pre>";
print_r($arr);
SimpleXMLElement解析xml
SimpleXMLElement解析xml非常简单,一次性把XML文档解析成一个多维对象(即包含了数组和子对象),但数组对象混合导致数据结构容易混淆。需要把它转为数组类型,参考以下分析思路
- 先把最外层对象转成数组,再循环数组,即类型强制转换 (array) $obj
- 若数组元素还是对象或数组,则继续调用自身函数来转换(递归思想)