我试图从here抢玩家名称和FP列。通常,当我需要表格信息时,我可以使用pandas
将其加载到Dataframe
中,或者至少使用bs4
运行find_all()
方法。我发现一个页面,推荐这样的:更简单的方法来刮这个困难的网站?
import requests
from bs4 import BeautifulSoup
scrape_url ='http://www.numberfire.com/nba/fantasy/full-fantasy-basketball-projections'
page = requests.get(scrape_url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'})
soup = BeautifulSoup(page.content, "html5lib")
script = soup.find('script', text=lambda x: x and 'NF_DATA' in x).text
data = re.search(r'NF_DATA = (.*?);', script).group(1)
data = json.loads(data)
print(data)
但没有工作,如果任何人有一定的指导我将不胜感激。