下午好,亲爱的社区,使用XPath提取信息
我终于编译了一个工作的XPaths列表,用于从我需要的URL中提取所有信息。
我想问你的建议,对于编码的新手什么是最好的方式来使用只有XPaths(每个链接约100 xpaths)的50k链接刮?
Import.io是我目前最好的工具,甚至是Excel的SEO工具,但他们都有自己的局限性。导入io是昂贵的,excel的SEO工具不适合提取超过1000个链接。
我很愿意学习系统建议,但请为我的项目建议一个好方法!
#已解决!搜索引擎优化工具爬行实际上是超级有用的,我相信我找到了我需要的东西。我想我会阻止Python或Java,直到我遇到另一个棘手的障碍。 谢谢大家!
可能的重复[如何在Python中使用Xpath?](http://stackoverflow.com/questions/8692/how-to-use-xpath-in-python) – n1c9