3
我想扫描一些网站,并希望获得所有的Java脚本文件的名称和内容。我尝试了与BeautifulSoup的Python请求,但无法获取脚本细节和内容。我错过了什么?获取所有的JavaScript文件名和它的内容在Python中完美
我一直在尝试很多方法来找到,但我觉得像在黑暗中绊倒。 这是我想
import requests
from bs4 import BeautifulSoup
r = requests.get("http://www.marunadanmalayali.com/")
soup = BeautifulSoup(r.content)
我试着用beautifulSoup.I请求不能用于扫描给出具体的类名,因为它所有的部位而异site.Identifying文件,如JavaScript本身是我的需求量的。 –
你的代码是什么?你可以[编辑]你的问题,并请添加[mcve]吗?你的意思是从页面中的所有'
您可以使用select与
script[src]
将只找到一个src脚本标记,你不”不需要打电话。获得多次:你也可以指定
src=True
与find_all做同样的:这都将给予你同样的输出:
此外,如果您使用硒,你可以使用PhantomJs进行无头浏览,如果你使用硒,你根本不需要beautufulSoup,你可以直接在硒中使用相同的css选择器:
,让你所有的链接:
来源
2016-03-28 10:20:10