2011-12-23 44 views
0

我有一个内置C#的网络爬虫(我知道),它在处理许多通常由一个实际的Web浏览器处理的功能方面已经相当复杂。也就是说,我没有任何东西可以解析传入的HTML并处理页面上的嵌入式JavaScript命令。寻找一个嵌入式JavaScript解析器

我已经尝试了许多方法 - 从Noesis到Awesomium - 但似乎没有工作。我也犯了使用WinForms嵌入式Web浏览器控件的错误,并且加载时的内存泄漏(我正在运行“并行任务”)从字面上损坏了CLR。也就是说,它能够将页面作为普通浏览器进行处理,并且生成的内容非常棒 - 不可行,但最终的结果内容却很重要。

那里有没有什么东西可以接受目标URL,或者理想情况下是接受通过HttpWebRequest下载的HTML内容并处理嵌入式JavaScript命令?

+0

http://htmlagilitypack.codeplex.com/ – themis 2011-12-23 17:30:30

回答