2016-08-24 33 views
-1

我是新来的网页抓取,到目前为止我只知道如何使用python美丽的汤刮基本的html页面。我想要的是提取关于这个page的信息。具体来说,我想摆脱所有的同伴以下数据(其中约700)如何用javascript效果刮一个页面

  • 背景
  • 洞察项目
  • 当前雇主

然而,页面由javascript呈现,当鼠标事件在每个同伴图片上触发时,所需信息仅显示为一个单独的框。

如何在这种情况下提取文本?任何信息(书籍,网络资源)表示赞赏。如果可能,Python解决方案是首选。非常感谢。

+0

我禁用了网站上的JavaScript,并且工具提示仍然显示。内容在那里,它只是通过CSS隐藏。 –

回答

0

检查网站的页面源。

该信息已经存在于DOM中,只是隐藏在CSS中。乍看之下,似乎JavaScript逻辑只是在进行CSS操作。

信息被CSS隐藏的事实不会阻止你使用网络抓取工具从源头上抓取它。