1
为了保持组织有序,我确定有三个项目类,蜘蛛会填充。重新包装Scrapy蜘蛛项目
每个项目类都有各种填充的字段。
class item_01(Item):
item1 = Field()
item2 = Field()
item3 = Field()
class item_02(Item):
item4 = Field()
item5 = Field()
class item_03(Item):
item6 = Field()
item7 = Field()
item8 = Field()
有多个页面可以抓取相同的项目。 在蜘蛛中,我使用XPathItemLoader来填充'容器'。
目标是将项目传递给mysql管道以填充单个表。但这是问题。
当我产生三个容器(每页)时,它们作为三个独立的容器传递到管道中。 他们通过管道作为他们自己的BaseItem并仅填充他们的mysql表的部分,而将其他列'NULL'。
我想要做的是将这三个容器重新打包到一个BaseItem中,以便它们作为单个ITEM传递到管道中。
有没有人有任何建议重新包装的项目?无论是在蜘蛛或管道?
感谢