1700417121
1700417122
1700417123
可以看到里面有很多用“<”和“>”括起来的单词,例如、、
、等。通常把它们称为“标签”。是用于表示这是HTML文件的标签,标签被赋予了意义,表示网页的头部,
表示网页标题,表示网页的主体,除此之外还有许多标签,例如使文字加粗显示的
,在网页中插入图片的
等
1700417124
1700417125
通常把通过添加标签为数据赋予意义的行为称为“标记”。为这种给数据赋予意义的行为定义规则的语言就是“标记语言”。HTML是用于编写网页的标记语言,更简单地说法就是HTML决定了可用于编写网页的标签
1700417126
1700417127
也可以这样说,可使用的标签的种类决定了标记语言的规范。Web浏览器会对HTML的标签进行解析,把由它们标记的信息渲染成在视觉上可以阅读的网页
1700417128
1700417129
1700417130
1700417131
1700417133
计算机是怎样跑起来的 11.2 XML是可扩展的语言
1700417134
1700417135
正如其名,XML是一种标记语言,XML文件的扩展名一般是.xml(使用别的也可以)。下面从Windows“开始”菜单打开“搜索”功能,找找自己计算机中有没有XML文件。笔者在自己的计算机中找到一个名为iuhist.xml的XML文件,该文件位于c:\program files\windowsupdate\v4。接下来试着用记事本打开这个文件(如图11.3所示)
1700417136
1700417137
图11.3 打开了XML文件iuhist.xml,可以看到里面使用了标签
1700417138
1700417139
1700417140
1700417141
1700417142
可以看到XML文件也使用了标签,在iuhist.xml中就有
和等标签,而且很有可能这两个标签表示的就是“发行者名字”和“处理器结构”
1700417143
1700417144
那么是XML规定了这些标签吗?答案是否定的。XML本身并不会限定标签的种类,反倒是允许XML的使用者随心所欲地创建标签。也就是说,在“<”和“>”中的单词可以是任意的。这就是所谓的“可扩展”。在HTML中,我们只能使用由HTML定义的若干种标签,因此HTML是固定的标记语言。与此相对,XML是可扩展的标记语言。也许会感到有些混乱,但只要回顾之前的讲解,就应该能清楚地区分HTML和XML
1700417145
1700417146
1700417147
1700417148
1700417150
计算机是怎样跑起来的 11.3 XML是元语言
1700417151
1700417152
XML并没有限定标签的使用方式,使用什么样的标签都可以。可以说XML仅仅限定了进行标记时标签的书写格式(书写风格)。也就是说通过定义要使用的标签种类,就可以创造出一门新的标记语言。通常把这种用于创造语言的语言称为“元语言”,例如,可以使用和等标签,创造一种属于自己的标记语言–宠物语言。不过,就算新语言是自己创造的,也毕竟属于XML格式的标记语言,所以不遵循一定的规范是不行的。如果只是在文档中胡乱地堆积标签,则无法称之为符合XML格式的语言。表11.1中列出了作为元语言的XML中的约束。因为这些约束都很简单,所以请先粗略地浏览一下
1700417153
1700417154
表11.1 XML中的主要约束
1700417155
1700417156
约束:示例
1700417157
1700417158
XML文档的开头要写有XML声明,表明使用的XML版本和字符编码:
1700417159
1700417160
1700417161
1700417162
信息要用形如“<标签名>”的开始标签和形如“标签名>”的结束标签括起来:
1700417163
1700417164
Tom
1700417165
1700417166
标签名不能以数字开头,中间也不能含空格:
1700417167
1700417168
<5cat>、不能作为标签名
1700417169
1700417170
由于半角空格、换行符、制表符(TAB)都会被视为空白字符,所以在文档中可以任务换行或缩进书写:
[
上一页 ]
[ :1.700417121e+09 ]
[
下一页 ]