xml元素类型PCDATA和CDATA的区别(DTD中)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介:

PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 &amp; &lt; &gt; 实体来分别替换它们。


CDATA
CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
几个实体引用字符
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '


又有网上有人这样说,我觉得挺直观,先转过来:
PCDATA表示已解析的字符数据。
CDATA不通过解析器进行解析的文本,文本中的标签不被看作标记。CDATA表示里面是什么数据XML不会解析,比如

 
  1. <![CDATA[ 
  2. if(a>b){ 
  3. System.out.println(a); 
  4. } 
  5. ]]> 


注意上面的a与b之间的 > 符号.

PCDATA的数据是要给xml解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义。上面的数据如果用PCDATA表示应该如下:

 
  1. if(a&gt;b){  
  2. System.out.println(a);  
  3. }


CDATA是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如js代码等。CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:

 
  1. <script>  
  2. <![CDATA[  
  3. function matchwo(a,b){  
  4. if (a < b && a < 0){  
  5. return 1;  
  6.  
  7. else{  
  8. return 0;  
  9.  
  10.  
  11. ]]>  
  12. </script>  

#PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的

 
  1. <?xml version="1.0"?> 
  2. <!DOCTYPE note [ 
  3.   <!ELEMENT note (to,from,heading,body)> 
  4.   <!ELEMENT to      (#PCDATA)> 
  5.   <!ELEMENT from    (#PCDATA)> 
  6.   <!ELEMENT heading (#PCDATA)> 
  7.   <!ELEMENT body    (#PCDATA)> 
  8. ]> 
  9. <note> 
  10.   <to>George</to> 
  11.   <from>John</from> 
  12.   <heading>Reminder</heading> 
  13.   <body>Don't forget the meeting!</body> 
  14. </note> 


关于实体引用,转载了一篇文章解释的比较好:
通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。在下列情况下,这样做很有用:
因为会被解释为标记,字符无法直接输入文档。
因为输入设备的限制,字符无法直接输入文档。
字符无法通过限于单字节字符的处理器可靠地传输。字符串或文档片断反复出现,并且可以缩写。为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。代码点可以使用十进制或十六进制表示法标识。
用于十进制引用的语法:    &#value;
用于十六进制引用的语法:  &#xvalue;

例如,要插入欧元符号,许多键盘上仍没有该字符,可以将 &#x20AC; 或 &#8364; 插入文档。
下表为 XML 标记使用的字符列出了五种内置实体。实体 实体引用 含义

实体 实体引用 含义
lt
&lt;
<(小于号)
gt
&gt;
>(大于号)
amp
&amp;
&(“and”符)
apos
&apos;
'(撇号或单引号)
quot
&quot;
"(双引号)


如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos; 和 &quot; 实体引用最常用在属性值中。

 

例一: 双引号的使用。

 

双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

 a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

<add key="IPhone" value="apple"/>  ...属性值为 ("apple").

解决:  <add key="IPhone" value=’"apple"‘/> 

 b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

<add key="IPhone" value="&quot;&apos;apple&quot;"/>  



      本文转自许琴 51CTO博客,原文链接:http://blog.51cto.com/xuqin/887799,如需转载请自行联系原作者




相关文章
|
2月前
|
XML JSON 数据可视化
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
本文详细介绍了不同数据集格式之间的转换方法,包括YOLO、VOC、COCO、JSON、TXT和PNG等格式,以及如何可视化验证数据集。
278 1
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
|
1月前
|
XML JavaScript 前端开发
|
2月前
|
XML 数据库 数据格式
|
4月前
|
XML 前端开发 安全
XML 中的 CDATA 部分
【8月更文挑战第22天】
67 0
|
4月前
|
XML 存储 数据库
XML 中的元素和属性
【8月更文挑战第22天】
105 0
|
4月前
|
XML 数据格式
DTD和XML Schema之间的区别?
【8月更文挑战第22天】
80 0
|
6月前
|
XML 存储 前端开发
【前端】XML和HTML的区别详解
【前端】XML和HTML的区别详解
152 5
|
7月前
|
XML JSON 前端开发
【Web 前端】XML和JSON的区别?
【4月更文挑战第22天】【Web 前端】XML和JSON的区别?
【Web 前端】XML和JSON的区别?
|
7月前
|
XML JSON 前端开发
初学者指南:JSON 和 XML 的区别
当我们讨论数据交换格式时,JSON(JavaScript对象表示法)和 XML(可扩展标记语言)无疑是最受欢迎的两种选择。这两者各有优点和缺点,根据具体的应用场景,选择合适的格式可以显著提高开发效率和系统性能。
|
7月前
|
XML 数据格式
XML Schema 复杂元素类型详解:定义及示例解析
在XML Schema(XSD)中,复杂元素包含其他元素和/或属性,分为4类:空元素、仅含元素、仅含文本和既含元素也含文本。定义复杂元素可通过直接声明或引用预定义的复杂类型。复杂空元素仅含属性,而仅含元素的类型则只包含其他子元素。XSD提供了`&lt;xs:sequence&gt;`、`&lt;xs:all&gt;`、`&lt;xs:choice&gt;`等指示器来规定元素顺序和出现次数,以及`&lt;xs:attributeGroup&gt;`和`&lt;xs:group&gt;`来组织元素和属性。
242 7