2012-04-01 100 views
1

我需要使用HTML敏捷包解析动态生成的HMTL代码。如何使用HTML Agility Pack动态解析HTML代码?

例如下面的代码:

<div class="navigation_noClass"> There are 43 articles </div> 

没有在Web浏览器的页面源代码显示选项,即这个代码可以使用一些检查工具(如Firebug)才可以看到,检查上下文...

+0

您可以在每行的开始处使用四个空格格式化代码 – dldnh 2012-04-02 00:22:55

回答

0

就在这一刻,它听起来像是将直接收到的HTML提供给Agility包,因此缺少一些常规浏览器会执行的一些(重要的)步骤。 即执行Javascript和/或CSS。

执行Javascript有许多选项,但大多数合理的“自包含”选项要求您重新创建DOM和关联的功能。不平凡。

然后就是那些CSS包含内容的场合(比如Before/After伪元素)。据我所知,在浏览器之外的HTML源代码上模拟CSS行为并没有太多的库。

所有这一切意味着,如果您确实需要捕获Javascript和/或CSS执行的输出,可能最容易将浏览器直接连接到应用程序处理管道(例如基于Chromium的产品之一)和询问其DOM(以类似于许多功能Web测试套件的方式)。

注意:如果这是一个严重大小的服务器样式处理任务,您可能希望将此类处理分配到专用服务器/应用程序池/进程,以便在适当的正常运行时间和/或内存中为您的应用程序提供战斗机会。

相关问题