-2
对不起,我的问题。 当我运行时,出现错误。我究竟做错了什么?请帮帮我。 我需要获得纽约时报的所有文章。Scrapy。错误意外缩进。 Python
class OrphanSpider(CrawlSpider):
name = "atical"
allowed_domains = ["www.nytimes.com"]
start_urls = ["https://www.nytimes.com/section/world?WT.nav=page&action=click&contentCollection=World&module=HPMiniNav&pgtype=Homepage®ion=TopBar"]
rules = (
Rule(SgmlLinkExtractor(allow=(), restrict_xpaths=('//*[@id="story"]/div/',)), callback="parse_items", follow= True)
)
def parse_item(self, response):
hxs = HtmlXPathSelector(response)
l = OrphanLoader(parse_item(), hxs)
l.add_value('url', response.url)
l.add_xpath('name', "//*[@id="headline"]" % u"Название статьи:")
l.add_xpath('text', "//*[@id="story"]/div/" % u"Текст:")
错误:
IndentationError: unexpected indent
'parse'方法缩进不正确。这是你问题中的错误还是错字? – kuro
@kuro它可能是错误的。怎么了?我不明白。 – Maria