2017-04-10 99 views
-2

对不起,我的问题。 当我运行时,出现错误。我究竟做错了什么?请帮帮我。 我需要获得纽约时报的所有文章。Scrapy。错误意外缩进。 Python

class OrphanSpider(CrawlSpider): 
    name = "atical" 
    allowed_domains = ["www.nytimes.com"] 
    start_urls = ["https://www.nytimes.com/section/world?WT.nav=page&action=click&contentCollection=World&module=HPMiniNav&pgtype=Homepage&region=TopBar"] 

    rules = (
      Rule(SgmlLinkExtractor(allow=(), restrict_xpaths=('//*[@id="story"]/div/',)), callback="parse_items", follow= True) 
      ) 

      def parse_item(self, response): 
       hxs = HtmlXPathSelector(response) 
       l = OrphanLoader(parse_item(), hxs) 
     l.add_value('url', response.url) 
     l.add_xpath('name', "//*[@id="headline"]" % u"Название статьи:") 
     l.add_xpath('text', "//*[@id="story"]/div/" % u"Текст:") 

错误:

IndentationError: unexpected indent 
+1

'parse'方法缩进不正确。这是你问题中的错误还是错字? – kuro

+0

@kuro它可能是错误的。怎么了?我不明白。 – Maria

回答

-2

你混合制表符和空格中的每一行的开头。使它们保持一致,无论是所有标签还是所有空格。或者它可能是这样的行:def parse_item(self,response):没有正确缩进