Folks, 我试图从C#中的网页中提取数据..目前我使用WebReponse的流,我解析它为一个大字符串。这是漫长而痛苦的。有人知道更好的方式从网页提取数据?我说WINHTTP,但不是为C#..提取数据网页
Q
提取数据网页
2
A
回答
0
如果网页是有效的XHTML,你可以阅读到一个XPathDocument和快速,轻松地直接XPath用自己的方式将数据你要。如果它不是有效的XHTML,我确信有一些HTML分析器可以使用。
找到了一个类似的问题,并提供一个有用的答案。 Looking for C# HTML parser
5
若要从网页上下载的数据更容易使用WebClient:
string data;
using (var client = new WebClient())
{
data = client.DownloadString("http://www.google.com");
}
对于解析下载的数据,只要它是HTML,你可以使用优秀的Html Agility Pack库。
而且这里有一个完整的例子提取特定页面中的所有链接:
class Program
{
static void Main(string[] args)
{
using (var client = new WebClient())
{
string data = client.DownloadString("http://www.google.com");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data);
var nodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach(HtmlNode link in nodes)
{
HtmlAttribute att = link.Attributes["href"];
Console.WriteLine(att.Value);
}
}
}
}
相关问题
- 1. 提取网页数据Python
- 2. 从网页中提取数据
- 3. 从网页中提取语义数据
- 4. 从网页提取内容数据
- 5. 从javascript网页中提取数据
- 6. 从网页上刮取网页数据
- 7. 网络数据提取器
- 8. 从网上提取数据
- 9. Python的网页抓取特殊字符提取数据
- 10. 使用python进行网页抓取以提取数据
- 11. 从网页获取数据
- 12. 从网页获取数据
- 13. 从网页读取数据
- 14. 从网页获取数据?
- 15. C#获取网页数据
- 16. 从网页提取价值
- 17. 提取网页内容
- 18. 从网页提取源
- 19. 提取部分的网页
- 20. PHP cURL不提取网页
- 21. 提供动态数据到网页
- 22. Blackberry:(Java)将数据提交到网页
- 23. 我试图从使用nsparser的网页中提取数据
- 24. 解析一个网页并提取数据
- 25. 从高度非结构化的网页中提取数据
- 26. 从网页中提取数据,包括HYPERLINKS - 使用VBA
- 27. 如何从网页中提取JavaScript动态数据
- 28. Selenium代码没有从网页中提取faccet数据
- 29. VBA加载网页并在内存中提取数据
- 30. 如何从网页中使用python提取数据
请你多解释一下 – 2013-10-30 20:57:32