xml元素类型PCDATA和CDATA的区别(DTD中)

简介:  PCDATAPCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。
 

PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 &amp; &lt; &gt; 实体来分别替换它们。


CDATA
CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
几个实体引用字符:
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '


又有网上有人这样说,我觉得挺直观,先转过来:
PCDATA表示已解析的字符数据。
CDATA是不通过解析器进行解析的文本,文本中的标签不被看作标记。CDATA表示里面是什么数据XML不会解析,比如

  1. <![CDATA[ 
  2. if(a>b){ 
  3. System.out.println(a); 
  4. ]]> 


注意上面的a与b之间的 > 符号.

PCDATA的数据是要给xml解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义。上面的数据如果用PCDATA表示应该如下:

  1. if(a&gt;b){  
  2. System.out.println(a);  
  3. }


CDATA是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如js代码等。CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:

  1. <script>  
  2. <![CDATA[  
  3. function matchwo(a,b){  
  4. if (a < b && a < 0){  
  5. return 1;  
  6. }  
  7. else{  
  8. return 0;  
  9. }  
  10. }  
  11. ]]>  
  12. </script>  

#PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的

  1. <?xml version="1.0"?> 
  2. <!DOCTYPE note [ 
  3.   <!ELEMENT note (to,from,heading,body)
  4.   <!ELEMENT to      (#PCDATA)
  5.   <!ELEMENT from    (#PCDATA)
  6.   <!ELEMENT heading (#PCDATA)
  7.   <!ELEMENT body    (#PCDATA)
  8. ]
  9. <note
  10.   <to>George</to
  11.   <from>John</from
  12.   <heading>Reminder</heading
  13.   <body>Don't forget the meeting!</body
  14. </note


关于实体引用,转载了一篇文章解释的比较好:
通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。在下列情况下,这样做很有用:
因为会被解释为标记,字符无法直接输入文档。
因为输入设备的限制,字符无法直接输入文档。
字符无法通过限于单字节字符的处理器可靠地传输。字符串或文档片断反复出现,并且可以缩写。为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。代码点可以使用十进制或十六进制表示法标识。
用于十进制引用的语法:    &#value;
用于十六进制引用的语法:  &#xvalue;

例如,要插入欧元符号,许多键盘上仍没有该字符,可以将 &#x20AC; 或 &#8364; 插入文档。
下表为 XML 标记使用的字符列出了五种内置实体。实体 实体引用 含义

实体 实体引用 含义
lt
&lt;
<(小于号)
gt
&gt;
>(大于号)
amp
&amp;
&(“and”符)
apos
&apos;
'(撇号或单引号)
quot
&quot;
"(双引号)


如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos; 和 &quot; 实体引用最常用在属性值中。

 

 

例一: 双引号的使用。

 

 

 

双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

 

 

 a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

 

 

<add key="IPhone" value="apple"/>  ...属性值为 ("apple").

 

 

解决:  <add key="IPhone" value=’"apple"‘/> 

 

 

 b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

<add key="IPhone" value="&quot;&apos;apple&quot;"/>  
目录
相关文章
|
3天前
|
XML JavaScript 数据格式
XML Schema(XSD)详解:定义 XML 文档结构合法性的完整指南
XML Schema(XSD)是用于定义XML文档结构的规范,它描述了元素、属性及其顺序、数据类型和约束。与DTD相比,XML Schema支持更多数据类型,如字符串、日期等,并且是基于XML的,允许扩展和重用。学习XML Schema有助于确保数据通信时双方对内容的理解一致,通过验证防止错误。示例展示了如何定义一个`note`元素,包含`to`, `from`, `heading`和`body`子元素,都是字符串类型。XML文档可以通过引用XML Schema进行验证,确保内容符合预设模式。
9 0
|
16天前
|
XML 存储 数据格式
探索 DTD 在 XML 中的作用及解析:深入理解文档类型定义
DTD(文档类型定义)用于定义XML文档的结构和合法元素、属性。它允许不同团体就数据交换标准达成一致,并用于验证XML数据的有效性。DTD可通过内部声明(在XML文档内)或外部声明(在单独文件中)来定义。内部声明示例显示了如何定义`note`元素及其子元素的结构,而外部声明则引用外部DTD文件。元素、属性、实体和PCDATA/CDATA是XML构建模块。DTD中,元素通过ELEMENT声明定义,属性通过ATTLIST声明定义,实体声明提供特殊字符或外部资源的快捷方式。
15 0
|
7月前
|
XML 数据管理 数据处理
XML入门,之dtd属性与元素详解
XML入门,之dtd属性与元素详解
28 1
|
9月前
|
XML 数据格式
把字符串写入xml中
把字符串写入xml中
51 0
|
XML Java 数据库连接
xml语法中<![CDATA[ ]]>的用法
<![CDATA[ ]]> 是什么,这是XML语法。特别是在mybatis中的mapper映射里会经常使用到该模块,具体点来说,当编译时xml文件时,在CDATA内部的所有内容都会被解析器忽略,
993 0
|
XML 数据格式
数组转xml
数组转xml
110 0
|
XML 自然语言处理 数据格式
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 设置 xml 标签内容 | 设置 xml 标签属性 )
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 设置 xml 标签内容 | 设置 xml 标签属性 )
250 0
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 设置 xml 标签内容 | 设置 xml 标签属性 )
|
XML 数据格式
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 标签闭包下创建子标签 | 使用 MarkupBuilderHelper 添加 xml 注释 )
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 标签闭包下创建子标签 | 使用 MarkupBuilderHelper 添加 xml 注释 )
302 0
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 标签闭包下创建子标签 | 使用 MarkupBuilderHelper 添加 xml 注释 )