0
一个Scrapy项目我是新来scrapy和我正在寻找一种方式来序列化我的Scrapy项目,以便能够将属性添加到我的XML输出,因为它看起来是这样的:序列化XML输出
<field name='example'> i have some data scraped here </field>
例如,我试图找到添加“名称”属性的方法。我知道这可能是通过重写XmlItemExporter类中的export_item()方法,但迄今为止我还没有运气。到目前为止,我XmlExportPipeline看起来是这样的:
from scrapy.exporters import XmlItemExporter
class XmlExportPipeline(object):
def open_spider(self, spider):
self.file = open('%s_products.xml' % spider.name, 'w+b')
self.exporter = XmlItemExporter(self.file, item_element='field', root_element='items')
self.exporter.start_exporting()
def close_spider(self, spider):
self.exporter.finish_exporting()
self.file.close()
def process_item(self, item, spider):
self.exporter.export_item(item)
return item
而且,到目前为止,我所有的数据都是我的项目的不同领域,但最好我会有些这些字段等领域的属性。