1
我需要一个解决方案来比较SecondSpider
的每个项目与FirstSpider
的所有项目。看看这个虚拟代码。如何比较每个Scrapy蜘蛛项目与另一个Scrapy蜘蛛项目?
class FirstSpider(Spider):
all_items = []
def parse(self, response):
trs = response.xpath("table tr")
for tr in trs:
item = SomeItem()
item["one"] = "one"
yield item
class SecondSpider(Spider):
def parse(self, response):
trs = response.xpath("table tr")
for tr in trs:
item = SomeItem()
item["one"] = "one"
if item in FirstSpider.all_items:
yield item
谢谢!
写每个单独的文件并使用实用程序'diff'?否则,您可能需要包含小样本输入和基于这些输入的所需输出。祝你好运。 – shellter