2011-05-20 171 views
3

是否有任何现有的框架可以下载完整的网页(不是网站):一个HTML页面,它的样式表,(javascript)和图像?下载完整的网页

如果可能,我想避免解析HTML和样式表。

回答

2

我知道有HTML Agility Pack - 这肯定会做HTML部分。

您将可以轻松地查询链接的图像,样式表和JavaScript文件,但它无法处理这些。

请参阅this SO问题的CSS解析。

除了使用JScript之外,我无法想到.NET的任何Javascript解析器。

+0

我结束了使用AgilityPack和一个简单的正则表达式从CSS中提取图像。 – jgauffin 2011-05-29 08:12:09

3

有一个wget CLI工具。它有一个完整的网页的-p选项:

wget -p www.yousite/page.html 
+0

我在ubuntu测试这个命令,真是太棒了,很有用 – 2012-02-01 23:46:51