我无法解析这个网站上正确的HTML:https://nwis.waterdata.usgs.gov/usa/nwis/gwlevels/?site_no=332857117043301解析HTML的网站刮
我想提取行“北纬34°02'48.57”,东经117°02'09.16" 。虽然这在管路862页面的源代码(网页开发工具)显示出来,它不显示,当我通过BeautifulSoup解析。使用lxml的分析器不产生任何所需的结果。
import requests
import re
from bs4 import BeautifulSoup
page = requests.get('https://nwis.waterdata.usgs.gov/usa/nwis/gwlevels/?site_no=340248117020902')
soup = BeautifulSoup(page.content, 'html.parser')
print (soup.prettify())
我打印声明页面内容不显示纬度/经度线。如何调整我的代码以刮取此信息?
谢谢维尼修斯。我假定当我通过“print(soup(prettify())”打印页面内容时会出现内容。“你能解释为什么它不会显示在那里,但通过findall方法工作? – saoirse
我很高兴(https://meta.stackexchange.com/a/5235)当我尝试你的代码时,它也显示在'print(soup)'中],也可以选择最有帮助的答案并[接受它] ,因为它应该,你有没有试图再次这样做? –
我试过了,打印语句不显示它。我的结果html有814行,这听起来是对的吗? – saoirse