我是python的新手,并且正在为funsies /教育目的构建一个web爬虫。我不使用任何递归函数,但仍然收到'RuntimeError:最大递归深度超出'错误。我很困惑,有点觉得我错过了某些明显的东西,或者只是误解了某些东西。我以某种方式递归,或者它可能与我的大循环有关?这个想法是抓取网页,直到您抓取10k页面。没有递归的Python递归错误?
更新:
最新的代码是在这里:http://pastebin.com/4v5GT7ft
堆栈跟踪是在这里:http://pastebin.com/9GzAxZM9
看起来像我的问题是试图调用STR()上是不正确编码的URL。我试过解码URL,然后将它们编码为unicode,但我从来没有能够成功完成。任何建议将不胜感激!
请确保包含python例外的* full * traceback。这节省了我们所有人必须*猜测*错误发生的地方。 – 2013-02-26 18:23:06
如果你正在解析HTML你*是*使用递归函数...我建议,当你失败时,你转储页面变量,看看Html是否形式错误 – Crisfole 2013-02-26 18:23:21
我现在在工作,我会发布完整的回溯当我今晚回家时。抱歉。 – Brian 2013-02-26 18:36:07