我需要一个关于我即将开始的项目的建议。需要建议:使用.NET屏幕抓取网页
简而言之,我的应用程序必须去某个足球网站,下载HTML并提取必要的数据。
这是我迄今所做的:
:: 1)到了一定的足球网站(前http://www.livescore.com/default.dll?page=england),并使用Web客户端下载HTML。
:: 2)使用SgmlReader的HTML转换成XML
:: 3)使用XmlDocument的检索我要找的数据。通常,这涉及到:
:::::::使用的getElementsByTagName 3.1)检索节点)
::::::: 3.2)()(前的getElementsByTagName( “TR”)。循环遍历由GetElementsByTagName()方法返回的节点列表
是否有更好的方法来做我想做的事情?
我在想LINQ to XML。你认为这会提高性能吗?
任何建议或意见将不胜感激!
我想我会使用HtmlAgilityPack,但是我发现的所有内容都是3个非常基本的例子以及糟糕的API引用。你知道更丰富的文档吗? – 2009-06-18 20:53:19