我想用scrapy从here中刮取结果。问题是,直到单击“加载更多结果”选项卡时,并非所有类都出现在页面上。我如何跳转到Scrapy的下一页
的问题可以在这里看到:
我的代码如下所示:
class ClassCentralSpider(CrawlSpider):
name = "class_central"
allowed_domains = ["www.class-central.com"]
start_urls = (
'https://www.class-central.com/courses/recentlyAdded',
)
rules = (
Rule(
LinkExtractor(
# allow=("index\d00\.html",),
restrict_xpaths=('//div[@id="show-more-courses"]',)
),
callback='parse',
follow=True
),
)
def parse(self, response):
x = response.xpath('//span[@class="course-name-text"]/text()').extract()
item = ClasscentralItem()
for y in x:
item['name'] = y
print item['name']
pass
那么第二个页面的网址是什么样的呢?如果它像www.website.com/Recently_Added/2那么这将是一个非常简单的解决方案。或者你实际上只是试图获取载入更多结果中出现的数据? – SAMO
这不起作用。我不知道如何获得网址第2页或致电[加载下一个..] – Yato
我们会是这仅仅是一个例子,我说如果URL以一种明显的模式变化,你可以利用它。好吧,你只是试图从'加载更多结果'选项卡中获得结果 – SAMO