HTML DOM与XML DOM的区别与联系探究-simple_html

这里向大家描述一下HTML DOM与XML DOM的区别与联系，本文内容的主题便是，为什么开发者要认为“DOM Level1规范的架构”是至关重要的，其突出的重要性在哪里等等，以及还有HTMLDOM和XML DOM之间微妙的区别及内在的联系。

大话HTML DOM与XML DOM的区别与联系

　　　W3C所制订的DOM Level分为两大模块：Core和HTML。***个大模块是Core核心，W3C规范是这样描述Core的：满足软件开发者和Web脚本编写者，访问和操控产品项目中包含的可解析的HTML和XML内容。

　　第二个HTML模块，规范描述为：HTML之中特定元素的功能，和恰到好处的、易用的、针对常见性任务的HTML文档操作机制。

　　以上可见两者的重要性。同时HTML模块的意义也在于，解决了向后兼容的问题，这在当今符合DOM Level1的浏览器中已经可以提供适应的解决方案。

　　按照这样的说法，如果您仍然不能理解上述的要义，我们则可以这样认为，HTML文档可以使用CoreAPI和HTMLAPI两者；而XML文档只能使用CoreAPI。换句话说，HTML与XML重叠的部分有CoreAPI，而HTMLAPI则是不能共享的部分，顾名思义限于HTML文档所使用。这是我们认识Core/HTML的初步认识。

理解DOM Level1 Core

　　理解DOM Level1Core之要义实质在于将Core看待成为许多节点（Nodes）而组成的文档（Document），也就是说，此文档结构中可允许存在着大量的条目项，其每一项都可理解为“节点”。讨论该结构可以以两个方面入手：一、一切皆是节点对象（NodeObject，扁平化的角度去理解，flattenedview，乃适合于多态下的接口）；二、每个对象继承于基类节点，实现了节点的接口（interface，OO继承的角度去理解）。请观察一下这段HTML：

viewplaincopytoclipboardprint?  
<dividdivid="myDiv"> 
HelloWorld</div> 
<dividdivid="myDiv">HelloWorld</div>

　　这是一个闭合的div标签。从DOM Level1的层面来分析可以有以下几点内容：

　　◆标签div可作为“节点对象NodeObject（扁平化角度，前面已述）”，或者元素对象ElementOBject（继承的角度-元素继承于Node）。

　　◆节点属性id也可作为“节点对象NodeObject（扁平化角度）”，或者属性对象Attr.OBject（继承的角度-Attr继承于Node）。

　　◆文本“Helloworld”也可作为“节点对象NodeObject（扁平化角度）”，字符串对象CharacterData对象（继承的角度-CharacterData继承于Node），Text文本对象（继承的角度-Text继承于CharacterData）。

　　稍微归纳一下，就是DOM1Core部分中一切皆是节点，节点以及其接口都可实现在每个对象身上（从继承的角度理解出发），实现了节点接口才可以有节点的属性、方法。——这是我们理解的前提。然后，根据特定的节点类型的不同，其接口的属性和方法都是不同的，视乎DOM对该节点的设计而定。#p#

理解DOM Level1 HTML

　　我们日常工作的时候，跟HTML文档打交道，其实就是属于W3C所规定的DOM Level1HTML模块内的处理工作。HTMLDOM的特性和方法不是标准的DOM实现，是专门针对HTML同时也让一些DOM操作变的更加简便。HTML模块集中表现在HTMLElement接口上，即为全体元素类型的对象所实现的接口。就该文讨论的范围而言，HTMLElement接口的参与形式与上述的Node节点接口非常地相似。一旦引入了OO设计观，只要实现了HTMLElement接口的对象，就可以定义它为元素了。一份HTML文档有相当多的都是元素，当然还有，表示文档本身的HTMLDocument和集合容器HTMLCollection等等。

　　因此，要准确理解DOM1HTML的模块，必须认识其接口是基于元素的（Element-based），而不是基于节点的（Node-based）。那样的话，元素方式与节点方式到底又有什么区别呢（Elementv.sNode），应该如何界定两者呢？例如节点属性（propertiesofelements），当在“基于元素”的语境中，就是“属性（attributes）”，并非独立的节点对象。——尽管按照某个角度讲，元素是节点的一种特例，我们仍可保留“节点”这一说法，一个标签（tag）便是一个“节点”。假如我们要得到id属性的字符串的值是什么，采用DOM1Core的方式就是：

viewplaincopytoclipboardprint?  
myElement.attributes["id"].value;//从Node接口提供的属性
myElement.attributes["id"].value;//从Node接口提供的属性

　　等于下面的方法：

viewplaincopytoclipboardprint?  
myElement.getAttributes("id");//从Element实现的方法返回  
myElement.getAttributes("id");//从Element实现的方法返回

　　但使用DOM1HTML方式的话，我们仅仅如此：

viewplaincopytoclipboardprint?  
myElement.id;myElement.id;

　　这般就可以获取id了。此时此刻，你可能会认为，XML文档本身就不一定缺省有id的属性，而因为有你所说的HTMLElement.id属性预先定义在API中，当然HTML中的每个元素就有id的属性啦——这里的意思没有错，也不妨碍我们的理解。的确全体的HTML元素均有id一项的属性，不管HTMLDivElement\HTMLImageElement\……

Core or HTML Module？

　　既然这样，那我应该使用Core的API，还是HTML模块的API？对于HTML的文档来说，用Core或HTMLModuel实际差别不大。本来我们一直都不太强调这种界定，以致忽略了它们细微的差异。如果我们觉得还是模棱两可的话，我们可进一步查探它们的明细。

　　个人认为处理XHTML并使用CoreAPI这样更能够说明XHTML的“X”，即表明这份HTML就是一份标准的XML文档，以便与原有HTML4.1从语义上区别开来。但请记住，当处理一份XML结构的文档的时候，自然而然就是采用Core去处理。通过XHMLHttpRequest请求执行后所返回的responseXML结果，只能使用Core的API去处理分析，就不能够采用HTML的了。

小结

　　通过文本开发者应该明白到，HTML DOM与XML DOM之间，既有区别，又有联系。一般而言，除了上述比较外，须值得一提的就是，HTML是可以允许不Well-Form的，XML就不行。

【编辑推荐】