我有scraperwiki一个非常简单的Python脚本:为什么scraperwiki会忽略被刮掉的html行?
import scraperwiki
import lxml.html
html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php")
print html
我没有写任何东西来分析它尚未......现在我只想HTML。
当我在编辑模式下运行它完美的作品。
当一个计划的Scrape运行(或我手动运行它)时,它会省略数十(甚至数百)行。
这是一个非常小的网页,所以数据超载应该不成问题。有任何想法吗?
你确定它不是一个如何在scraperwiki上处理印刷的假象吗? – Marcin 2012-03-07 14:39:40
不确定...我在我的html输出中间出现一行,它的内容如下所示 - 实际数字每次都不相同(括号中包括):[53行,159000个字符省略] – maneesha 2012-03-07 14:43:24
在scraperwiki文档中找不到任何内容关于它 – maneesha 2012-03-07 14:44:55