2017-09-06 52 views
0

我使用webdriver的硒在此刻,它完美的作品,但它不是我所期待的。我不喜欢的硒webdriver的是,它运行的浏览器(我知道有在后台运行某些方面)的一个真实的会话的事实。是否有任何其他库使用xpath进行网页抓取?最佳Python库为使用XPath网页抓取?

回答

1

这种情况的最佳框架是Scrapy。它有很多好东西,像中间件,管道,蜘蛛。你可以用它单独或与像硒,请求,代理等.. 附加库如果你想使用Selenium - PyVirtualDisplay将帮助你隐藏浏览器窗口