使用LazyLoader使用Python爬取页面BeautifulSoup

我正在与BeautifulSoup玩耍，我喜欢它。使用LazyLoader使用Python爬取页面BeautifulSoup

问题是我试图报废的网站有一个懒惰的浏览器......而且它只剩下一部分网站。

我可以提示如何继续？我必须看看如何实现lazyloader并参数化其他任何内容吗？

2013-02-14 Dynelight

您目前如何下载网页的内容？你可以看看这个问题的答案用JavaScript来刮页面：http://stackoverflow.com/questions/3362859/scraping-websites-with-javascript-enabled – Joe 2013-02-15 03:29:57

事实证明，问题本身不是BeautifulSoup，而是页面本身的动态。对于这个特定的情况。

该页面返回页面的一部分，因此需要分析标题并相应地发送到服务器。这不是一个BeautifulSoup问题本身。

因此，看看数据如何加载到特定网站上很重要。它并不总是一个“加载整个页面，处理整个页面”的范例。在某些情况下，您需要加载部分页面并向服务器发送特定参数，以便继续加载页面的其余部分。

来源

2013-04-27 11:37:15 Dynelight

使用LazyLoader使用Python爬取页面BeautifulSoup

回答

相关问题