我已经在python scrapy中编写了一个脚本来解析yellowpage中的一些项目。当我执行我的脚本时,它确实解析所有项目。然而,我遇到问题,无论何时写入这些被刮取的数据相应地在一个csv文件中,当我打开csv文件并填充数据时,我发现数据已经打印在其他行中。我怎样才能摆脱空白行?我正在粘贴脚本信息以供您考虑。Scrapy在每隔一行打印一个csv文件中的数据
“items.py” 包括:
from scrapy.item import Item, Field
class RealypItem(Item):
Name = Field()
Address = Field()
Phone = Field()
“yp.py” 又名蜘蛛包含:
from scrapy.spider import BaseSpider
class MySpider(BaseSpider):
name = "YellowPage"
allowed_domains = ["yellowpages.com"]
start_urls = ["https://www.yellowpages.com/search?search_terms=Coffee%20Shops&geo_location_terms=Los%20Angeles%2C%20CA&page=2"]
def parse(self, response):
page = response.xpath('//div[@class="info"]')
for titles in page:
Title = titles.xpath('.//span[@itemprop="name"]/text()').extract()
Adr = titles.xpath('.//span[@itemprop="streetAddress" and @class="street-address"]/text()').extract()
Tel = titles.xpath('.//div[@itemprop="telephone" and @class="phones phone primary"]/text()').extract()
yield{'Name':Title,'Address':Adr,'Phone':Tel}
命令我使用运行该脚本:
scrapy crawl YellowPage -o items.csv -t csv
以下是csv文件中填充数据的部分图片:
你能发布实际文件内容而不是截图吗?也许你的软件只是误解了csv? – Granitosaurus
感谢您的评论。稍后会附上该文件的链接。 – SIM
这里是该csv文件的链接:“https://www.dropbox.com/s/xt49h3p3hx7sn7l/items.csv?dl=0” – SIM