我想刮这个网页上的表的统计信息:http://stats.nba.com/teams/traditional/但我无法找到该表的HTML。这是在Python 2.7.10。Python和美丽的汤网页刮
from bs4 import BeautifulSoup
import json
import urllib
html = urllib.urlopen('http://stats.nba.com/teams/traditional/').read()
soup = BeautifulSoup(html, "html.parser")
for table in soup.find_all('tr'):
print(table)
这是我现在的代码,但没有输出。 如果我尝试使用页面上的不同元素,它工作正常。
表值通过JavaScript渲染,所以你将需要一个JavaScript解析器来获得的值,而不是BeautifulSoup – smoggers
你有一个JavaScript分析器的建议? – johnbowman
如果您知道数据来自哪里,那么您并不需要使用JavaScript解析器,在这种情况下,它是http://stats.nba.com/stats/leaguedashteamstats?Conference=&DateFrom=&DateTo=&Division=&GameScope=&GameSegment =&LastNGames = 0&LeagueID = 00&位置=&MeasureType =基地&月= 0&OpponentTeamID = 0&结果=&PORound = 0&PaceAdjust = N&PerMode = PerGame&周期= 0&PlayerExperience =&PlayerPosition =&PlusMinus = N&排名= N&季节= 2016-17&SeasonSegment =&SeasonType =普通+季&ShotClockRange =&StarterBench =&TeamID = 0&VsConference =&VsDivision = – Shane