我试图从href中提取链接。 <a class="p_l" href="" id="0" target="_blank">
这是在页面查看源中可见的内容,但是当我使用萤火虫检查时,href将包含http://home.website.com/preview/preview?uname=3eadsf132sdas
。我试过使用htmlagilitypack但href返回null。如何提取href中的链接。如何获取href内容
0
A
回答
1
如果你还没有尝试过这种方式比请尝试这种方式
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags=true;
htmlDoc.Load(filePath);
foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
{
if(link != null)
{
if(link["href"] != null)
{
HtmlAttribute att = link["href"];
var url = att.Value;
}
}
1
你可以尝试不同的东西,喜欢把自己使用WebRequest类的HTML内容(见here如何)。
如果href不包含任何链接,这可能意味着它正在使用Javascript或其他编程语言填充以添加动态内容。如果你有权访问脚本,那么你可能有一个很小的机会获得链接,但不这么认为。
相关问题
- 1. 从html获取href内容和src内容
- 2. 如何从html元素获取href内容
- 3. framelayout如何获取内容?
- 4. 如何获取内容?
- 5. 如何从href获取QueryString?
- 6. 如何避免Nokogiri编码href内容?
- 7. <a href =“/ test /”如何加载内容?
- 8. 获取内容
- 9. 硒Python如何从href中获取网页内容而不点击它
- 10. 如何从c#中获取我的href标记内容以插入链接?
- 11. 如何在JavaScript中获得“原始”href内容
- 12. Python。从Google搜索结果中仅获取href链接内容
- 13. 如何获取WebView内容大小
- 14. 如何获取html元素内容
- 15. 如何用jquery获取textarea内容
- 16. 如何获取ComboBox.SelectedItem的内容?
- 17. 如何获取HTML标签的内容?
- 18. 如何从UIWebView获取内容?
- 19. 如何获取ScrolledText的内容?
- 20. 如何从about:cache?获取内容?device = disk
- 21. 如何获取我的JTextPane的内容?
- 22. 如何获取StackPanel的内容高度?
- 23. 如何获取html标签内容
- 24. Javascript:如何获取网址的内容?
- 25. 如何使用SAX获取CDATA内容
- 26. 如何从System.ServiceModel.Channels.Message获取消息内容?
- 27. 如何获取Java库中的内容?
- 28. 如何获取已阅读的内容
- 29. 如何获取网页内容(android)?
- 30. 如何获取PUT请求的内容?
这是因为空的'href'的意思是“无论当前的网址是什么”。 Agility Pack无法知道您从何处获取HTML。 – Jon 2012-08-13 10:58:02
是否可以提取链接。如何获得href中的链接。 – Maddy 2012-08-13 11:03:13
@Maddy重申第一位评论者所说的话,没有什么可以提取的。 Firebug向您展示* Web浏览器*所了解的内容。 HTML敏捷包只知道* HTML源*知道什么。浏览器知道它从何处加载HTML,而Html Agility Pack则没有。而不是看着萤火虫,看看“查看来源”。这就是HAP实际所看到的。 – 2012-08-13 11:39:41