2013-02-14 85 views
2

我正在与BeautifulSoup玩耍,我喜欢它。使用LazyLoader使用Python爬取页面BeautifulSoup

问题是我试图报废的网站有一个懒惰的浏览器......而且它只剩下一部分网站。

我可以提示如何继续?我必须看看如何实现lazyloader并参数化其他任何内容吗?

+0

您目前如何下载网页的内容?你可以看看这个问题的答案用JavaScript来刮页面:http://stackoverflow.com/questions/3362859/scraping-websites-with-javascript-enabled – Joe 2013-02-15 03:29:57

回答

0

事实证明,问题本身不是BeautifulSoup,而是页面本身的动态。对于这个特定的情况。

该页面返回页面的一部分,因此需要分析标题并相应地发送到服务器。这不是一个BeautifulSoup问题本身。

因此,看看数据如何加载到特定网站上很重要。它并不总是一个“加载整个页面,处理整个页面”的范例。在某些情况下,您需要加载部分页面并向服务器发送特定参数,以便继续加载页面的其余部分。