更新2:下面是一个代码示例如何使用Html Agility Pack获取属性值:
http://htmlagilitypack.codeplex.com/wikipage?title=Examples
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link.Attributes["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
你显然需要将此代码适应您的需求 - 比如你将不会修改属性,而只是用att.Value
。
更新:您也可以看看这个问题:
Selecting attribute values with html Agility Pack
你的问题很可能是默认命名空间问题 - 搜索“的XPath默认命名空间C#“,你会发现很多好的解决方案(提示:使用SelectNodes()
,它有一个XmlNamespaceManager
变元)。
下面的代码显示了一个获取对文档中的一个属性 “没有命名空间”:
using System;
using System.IO;
using System.Xml;
public class Sample
{
public static void Main()
{
XmlDocument doc = new XmlDocument();
doc.LoadXml("<input value='novel' ISBN='1-861001-57-5'>" +
"<title>Pride And Prejudice</title>" +
"</input>");
XmlNode root = doc.DocumentElement;
XmlNode value = doc.SelectNodes("//input/@value")[0];
Console.WriteLine("Inner text: " + value.InnerText);
Console.WriteLine("InnerXml: " + value.InnerXml);
Console.WriteLine("OuterXml: " + value.OuterXml);
Console.WriteLine("Value: " + value.Value);
}
}
运行这个程序的结果是:
Inner text: novel
InnerXml: novel
OuterXml: value="novel"
Value: novel
现在,对于处于默认命名空间的文档:
using System;
using System.IO;
using System.Xml;
public class Sample
{
public static void Main()
{
XmlDocument doc = new XmlDocument();
doc.LoadXml("<input xmlns='some:Namespace' value='novel' ISBN='1-861001-57-5'>" +
"<title>Pride And Prejudice</title>" +
"</input>");
XmlNode root = doc.DocumentElement;
XmlNamespaceManager nsmgr = new XmlNamespaceManager(doc.NameTable);
nsmgr.AddNamespace("x", "some:Namespace");
XmlNode value = doc.SelectNodes("//x:input/@value", nsmgr)[0];
Console.WriteLine("Inner text: " + value.InnerText);
Console.WriteLine("InnerXml: " + value.InnerXml);
Console.WriteLine("OuterXml: " + value.OuterXml);
Console.WriteLine("Value: " + value.Value);
}
}
运行这个程序,再想要的结果生产:
Inner text: novel
InnerXml: novel
OuterXml: value="novel"
Value: novel
你试过'node [0] .Value'吗? – Oded 2011-12-29 10:55:13
不,因为我想通过'node [0] .InnerText' – 2011-12-29 10:59:05
获取值但是一个属性没有'InnerText'。 – Oded 2011-12-29 12:16:31