Why do inner text is not active Here is HTML code [这里是HTML代码] <ul class="product">
<li class="product col-md-4 col-sm-4 col-xs-6 "><div class="product-header">
<a href="/so-mi-octopus-xanh-soc-trang
我想要获取的网址数量在SitemapSpider之间。我试图覆盖start_requests方法,但它打印0.我有一个sitemap_url其中包含数千个网址。我想得到这些网址的数量。 这是我尝试过的,但我想从站点地图的Url不在start_urls。 class MainSpider(SitemapSpider):
name = 'main_spider'
allowed_d
我是Scrapy的新手,目前我正在尝试编写一个CrawlSpider来抓取Tor darknet上的论坛。目前我CrawlSpider代码: import scrapy
from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor
class HiddenAnswer