LINQ to XML提供了为丰富并且简洁的类来实现对XML的操作。相对于种类繁多的DOM模型的XML类库而言,LINQ的类使我们的学习曲线变得平滑并且还能达到相同的效果。LINQ to XML解决了DOM模型中的几个比较不方便的问题,如修改节点名字的问题;同时也抛弃了一些看起来很强大但是很不常用的东西,如实体和实体引用。这样使得LINQ to XML的操作速度更快并且更方便。以下的几个例子将展示给大家LINQ to XML如何完成节点名称修改,增加和删除的效果。
首先,我们看一下添加一个节点到XML中是这么样实现的:
- XElement xelem = XElement.Load(@"example.xml");
- XElement newnewXelem = new XElement("NewNode", "This is new node");
- xelem.Add(newXelem);
相当的简单,只要先生成一个XElement对象然后把它Add到当前节点对象就可以了。进一步我们仔细查看一下XElement可以添加节点的方法。可以看到一共有Add, AddAfterSelf, AddAnnotation, AddBeforeSelf, AddFirst这五个方法。在默认情况下,Add的操作是将新节点作为被插入节点的最后一个孩子节点插入的,而AddFirst正好相反。AddAfterSelf和AddBeforeSelf则是将节点作为兄弟节点插入的,这里要注意的是调用这两个方法的时候不能以根节点作为被插入节点,因为XML文档规定只能有一个根节点。最后,我们来看一下AddAnnotation这个方法。
AddAnnotation是为一个节点添加一个相关的评注的类对象。这个类对象可以用户自己定义,所以通过这个方法我们可以扩展XML文档对象的功能,例如根据节点来获取类对象的功能。下面是一段引用自msdn的代码:
- public class MyAnnotation
- {
- private string tag;
- public string Tag { get { return tag; } set { tag = value; } }
- public MyAnnotation(string tag)
- {
- this.tag = tag;
- }
- }
- … …
- MyAnnotation ma = new MyAnnotation("T1");
- XElement root = new XElement("Root", "content");
- root.AddAnnotation(ma);
- MyAnnotation ma2 = (MyAnnotation)root.Annotation<MyAnnotation>();
接下来我们再看一下如何利用LINQ to XML来更新XML的信息。对XML文档进行更新主要包括两个方面,一个方面是对元素属性和值得更新;另一方面是对元素名称的更新。在一般情况下,我们通常只对元素的属性和值进行更新,代码如下:
- XElement xelem = XElement.Load(@"example.xml");
- var partNos = from item in xelem.Descendants("Item")
- where item.Attribute("PartNumber").Value == "872-AA"
- select item;
- foreach (XElement node in partNos)
- {
- node.Value = "Hello";
- Console.WriteLine(node.Value);
- }
对于XML元素的更新操作,关键就是在于查询上面,如何有效并准确的查询到目标元素是一个比较有挑战性的问题,这就像SQL语句一样对于同一个查询不同的写法和关系连接效率就不一样,这个读者需要自己多加练习。在上面的代码段中,我们去查找所有属性为PartNumber=872-AA的元素并将其更新为Hello。那么如果想操作元素值,只需将修改查询条件为:
- var partNos = from item in xelem.Descendants("ProductName")
- where item.Value == "Lawnmower"
XML文档的元素名称更新相比较于值更新要麻烦许多。由于XML文档结构是一个类树形结构,学过数据结构的读者知道要更新一个树节点的指针,最少需要三个步骤 :
A. 查找目标树节点的父节点
B. 将先前的节点的孩子转移到新节点
C. 将父节点的子节点替换(如果需要还要用算法重新排序树)。
所以我们也需要用同样的逻辑来处理XML节点的更新。那么相比较DOM文档对象和LINQ to XML对元素名称更新操作,LINQ to XML的步骤要简单许多。
- XElement xel = XElement.Load(@"example.xml");
- var itemNos = from item in xel.Descendants("Item")
- select item;
- int n = itemNos.Count();
- for (int i=0; i<n; i++)
- {
- // 新创建节点
- XElement nEl = new XElement("Element");
- // 转移孩子节点
- nEl.Add(itemNos.ElementAt(0).Elements());
- // 替换
- itemNos.ElementAt(0).ReplaceWith(nEl);
- }
- Console.Write(xel);
上面的代码是将所有名称为Item的元素替换成名称为Element。细心的读者可以看到我在for循环中获取itemNos的孩子都使用0这个索引值,为什么呢?这是因为在枚举器中如果前面的对象消失那么索引位置就会下移,那么当我们替换一个元素后,下一个元素的索引自动变为0,所以我们只要循环指定次数就可以遍历所有元素来。这也是为什么不用foreach的原因。那么我们进一步的出思考XML名称替换这个问题。我们会发现LINQ to XML的 XElement类提供了4个方法用来支持该功能:ReplaceAll, ReplaceAttributes, ReplaceNodes和ReplaceWith。这四个方法除了ReplaceWith是操作本元素以为,其他的都是操作元素的孩子或是属性内容。这里提供的好处是如果我们想遍历替换操作,就不必去重复的查询目标元素。
最后,我们讨论一下如何利用LINQ to XML来删除一个元素。对于类树形结构的数据来说,删除一个元素意味着两种情况:一、删除本节点和其所有子节点;二、只删除本节点。而在删除节点之前,我们需要先定位到目标节点,所以要先进行查询操作:
- XElement xelem = XElement.Load(@"example.xml");
- var partNos = from item in xelem.Descendants("Item")
- where item.Attributes("PartNumber").Single().Value == "872-AA"
- select item;
- partNos.Remove();
- Console.Write(xelem);
【编辑推荐】