我有一个page,它有一个我需要删除的表(表id =“ctl00_ContentPlaceHolder_ctl00_ctl00_GV”class =“GridListings”)。 我通常使用BeautifulSoup & urllib,但在这种情况下,问题是表需要一些时间来加载,所以当我尝试使用BS获取时,它并未被捕获。 我不能使用PyQt4的,drysracpe或风车因为一些安装问题,所以唯一可能的方式是使用硒/ PhantomJS 我尝试以下,仍然没有成功:需要废弃通过ajax使用python加载的表格(selenium)
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.PhantomJS()
driver.get(url)
wait = WebDriverWait(driver, 10)
table = wait.until(EC.presence_of_element_located(By.CSS_SELECTOR, 'table#ctl00_ContentPlaceHolder_ctl00_ctl00_GV'))
上面的代码犯规给我表中所需的内容。 我该如何去实现这个?
你是什么意思不给我想要的内容?有什么异常吗?你能不能在这里分享你的表格HTML? –
嗨,[链接](https://seahawks.strmarketplace.com/Charter-Seat-Licenses/Charter-Seat-Licenses.aspx)底部表是我想要的(表类=“GridListings”) – user3425403
我'对不起,但我不能查看表格这一次,这就是为什么我告诉你在这里分享表格HTML .. –