只表示会以表格的形式呈现信息,作为程序要处理的数据格式,从图11.7所示的HTML文件中提取出商品编号、商品名称和价格的过程将非常繁琐。那么像下面这样做呢?首先定义出
1700417260
1700417261
在商业领域存在着不计其数的信息,蕴涵着各种各样的意义。行业不同,信息的类型也就不同。并且随着时代的发展,新兴行业还在不断涌现,如果要适用于所有行业,那么就算是HTML的标签再多也还是不够用。于是就发明了XML这种元语言,而HTML的用途也就仅于信息的可视化了,自始至终都用于展现网页。这也就是要告诉大家:今后请使用更加灵活的XML为各个行业、各个特殊用途创建标记语言。也就是说,XML的主要用途是为在因特网上交换的信息赋予意义(如图11.9所示)。
1700417262
1700417263
图11.9 HTML是给人看的,XML是给计算机看的
1700417264
1700417265
![]()
1700417266
1700417267
1700417268
当然,在因特网以外的场景也可以使用XML。不过XML诞生的过程中因特网一直伴随其左右。
1700417269
1700417270
在因特网的世界中,有一个叫做W3C(World Wide Web Consortium,万维网联盟)的机构。该机构以W3C推荐标准的形式制定了一系列标准。XML于1996年成为W3C的推荐标准(XML 1.0)。这之后,人们使用XML这种元语言,又定义出了新的网页标记语言XHTML(eXtensible Hypertext Markup Language,可扩展超文本标记语言),该语言于2000年成为了W3C推荐标准。预计将来XHTML会取代现行的HTML(HTML 4.0)成为编写网页的主流标记语言(原书于2003年出版,那时还没有HTML 5)
1700417271
1700417272
1700417273
1700417274
1700417275
计算机是怎样跑起来的 [:1700412738]
1700417276
计算机是怎样跑起来的 11.5 XML是通用的数据交换格式
1700417277
1700417278
W3C的推荐标准是不依赖于特定厂商的通用规范。因此可认为成为W3C推荐标准是一种通用的数据交换格式。也就是说,如果某家厂商的某个应用程序把数据保存到了XML文件,那么其他厂商的另一个应用程序就应该可以通过加载这个XML文件来使用数据。除此之外,XML也可以在同一个厂商的不同应用程序之间交换数据
1700417279
1700417280
XML并不是第一个跨越厂商或应用程序差异的通用数据交换格式。在计算机行业,长久以来一直把CSV(Comma Separated Value,逗号分隔值)作为通用数据交换格式沿用至今。下面就试着对比一下XML和CSV
1700417281
1700417282
与XML一样,CSV也是仅由字符构成的纯文本文件。一般情况下,CSV文件的扩展名为.csv,正如其名,在CSV文件内,记录的是经过“,”(半角逗号)分隔后的信息。例如,上一节提到的购物网站中的商品信息如果用CSV表示的话,就如图11.10所示
1700417283
1700417284
图11.10 购物网站的CSV文件
1700417285
|