我有兴趣尝试网络抓取项目。目标网站使用Javascript来动态加载和更新内容。大多数关于网站抓取此类网站的讨论表明,在尝试这样的项目时,node.js,casper.js,phantom.js和nightmare.js都是合理流行的工具。 Node.js似乎最常用。运行Flask Web服务器是否会阻止Node.JS中的网页抓取?
如果我正在运行Flask服务器并希望显示node.js的结果,例如,在我的网站上以表格格式进行刮擦,这可能吗?我会遇到兼容性问题吗?或者我应该尝试使用基于python的方法将其与BS4拼凑起来以保持一致性?我问,因为node.js被描述为一个服务器,所以我假设如果我试图同时使用它和Flask,就会出现冲突。
谢谢!起初我以为节点只是另一种语言,然后我开始阅读,并将它看作是一个Web服务器。接下来,幻影,casper和噩梦从木制品中出现,这增加了混乱。我衷心感谢清晰而简明的回应! – Ryan