七、XML模型
XML(extensible markup language)是一种可扩展的标记语言,用户通过自定义的标记来描述文档的结构。XML是万维网联盟(world wide web consortium,W3C)在1998年制定的一项标准,是标准通用标记语言(standard generalized markup language,SGML)的一个子集。随着WEB应用的快速发展,越来越多的应用将数据表示成XML的形式,XML已经成为网络数据交换的标准。
1.XML文档简介
下面简单介绍XML文档常用的语法成分,图1-15为一个XML文档的例子。
(1)XML声明(XML declaration) XML声明必须在文档的第一行,是对文档处理的环境和要求的说明。例如:
<?xml version="1.0"encoding="UTF-8"standalone="no"?>
xml version说明使用的XML的版本号,其中字母是区分大小写的。encoding是文字编码说明,指出文档所用的字符集。standalone是独立文档说明,"yes"表示XML文档中所有的实体声明都包含在文档内部,而"no"表示需要引用外部的标记声明。
(2)元素(element) 元素是XML文档的主要组成部分。图1-15中pub、library、book都是元素。元素有名字,即标记名。元素以<标记名>开始,以</标记名>结束,如<pub></pub>、<library></library>、<book></book>等。XML文档必须有且只有一个根元素,第一个元素就是根元素,图1-15中pub是根元素。元素的名字区分大小写,元素可以嵌套。
图1-15 XML文档示例
(3)属性 属(attribute)性用来描述元素的有关信息。属性名和属性值在元素的起始标记中给出,形式为<元素名 属性名="属性值">,如<book ISBN="019583-1">。一个元素可以有多个属性,属性值必须出现在引号中。
(4)处理指令(processing instructions) 是为使用特殊代码段设计的标记,通常用来为处理XML文档的应用程序提供信息,包括如何处理文档、如何显示文档等。
(5)注释(comments) XML中注释以<!--开始,以-->结束,位于这两个字符序列之间的是注释。注释可以在XML文档的任意位置插人。
(6)实体(entities) XML文档中对于重复使用的文档内容可以用实体定义,格式为<!ENTITY实体名"实体内容">。当XML遇到&实体名时就用实体内容来代替。
2.XML的主要特点
XML语言具有如下主要特点。
(1)自描述 对数据的描述和数据本身都包含在文档中,具有很大的灵活性。
(2)可扩展性 允许用户自定义标记和属性,数据格式可定制。
(3)数据和显示分离 XML所关心的是数据本身,而不是数据的显示,在XML数据上可以定义多种显示形式。
(4)简洁性 同标准通用标记语言SGML相比,XML语言简洁,易学易用。