我想从http://search.freefind.com/siteindex.html?id=59478474<r=10240&fwr=0&pid=i&ics=1 我想是这样的链接取消所有的字:使用htmlAgilityPack刮除<a>标签的所有内部文本
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load("http://search.freefind.com/siteindex.html?id=59478474<r=10240&fwr=0&pid=i&ics=1");
HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//font[@class='search-index-font']//a");
if (nodes != null)
{
foreach (HtmlNode n in nodes)
{
link = n.InnerText;
my_link.Add(link);
MessageBox.Show(link);
}
}
else
MessageBox.Show("no wordfound ");
我expexted输出谨
a
aa
aachhe
aagrashi
aagun
aaj
aam
aanka
aankhi
aar
aashman
abāddhō
abāddhōtā
abadh
..
..
但它没有工作? 它显示“找不到字”意味着它返回null。如何从< a>标签获得所有文本? 谁能告诉我什么应该在SelectNodes(“”)?
_did_发生什么? “它不起作用”不是一个有助于解决问题的很好的描述。 – Oded 2013-02-22 13:53:03
它显示“没有发现任何词”.... – DarkenShooter 2013-02-22 13:56:46
该页面上的标记完全被打破。在你正在搜索的块中没有开放的'a'元素。例如:' a
aa' - 没有用于HAP匹配的''。 – Oded 2013-02-22 13:57:36