我有一个接近800页的网站。我想提取所有的HTML并将代码放在XML中。我怎样才能做到这一点?从网站中提取html
0
A
回答
3
PHP Simple HTML-DOM用于解析HTML和良好的旧DOM或Simple-XML用于创建XML。
+0
@mario页面是静态的HTML页面。我只想提取HTML并将其保存到XML文件中。没有要使用的数据库。 PHP简单的HTML-DOM如何? – 2011-05-13 13:15:50
+0
我想我不太明白你的问题。您不需要简单HTML-DOM的数据库。你只是包括图书馆,你很好去。它只是想要你想要的。 – schlingel 2011-05-13 19:36:07
相关问题
- 1. 从网站中提取HTML部分?
- 2. Android - 如何从FTP网站提取HTML
- 3. 无法从网站提取HTML
- 4. 从网站中提取网址?
- 5. C#:从网站读取HTML
- 6. 从网站提取图像
- 7. 从网站提取信息
- 8. 从网站提取价值
- 9. 使用python从网站中提取HTML的部分
- 10. 从javascript保护的网站中提取HTML代码
- 11. 从网站中提取链接
- 12. 从URL中提取网站名
- 13. 从网站中提取.csv文件
- 14. JSOUP从html中提取绝对网址
- 15. 如何从网页的网址中提取网站的网址?
- 16. Android - 从网站提取数据的选项? (HTML)
- 17. 如何从简单的html-dom网站提取图像?
- 18. 从网站提取html数据到excel vba
- 19. 如何从网站获取句子html
- 20. Android WebView:从网站获取html div
- 21. Clojure从网站获取html页面
- 22. 从网站获取实时html源
- 23. 从网站提取特定行
- 24. 提取从网站使用VBA
- 25. 使用iMacros从网站提取数据
- 26. 从外部网站提取信息
- 27. 从网站提取数据表
- 28. 从网站使用rvest提取表格
- 29. 从网站提取域和路径
- 30. 使用python从网站提取数据
你想如何提取它?从静态文件?什么样的XML? – mario 2011-05-12 20:30:16
如果它们是x-html页面,那么'ren * .html * .xml'就可以做到这一点。但是,真的,不知道你如何存储你的网页,这个问题是无法回答的。你有CMS并将它们存储在数据库中吗?基于文件的存储机制,就像单个.html文件或一个主PHP文件一样,只需根据需要包含页面? – 2011-05-12 20:30:57
[解析HTML的最佳方法]的可能重复(http://stackoverflow.com/questions/3577641/best-methods-to-parse-html) – Gordon 2011-05-12 20:56:43