我想检索SDMX文件(如https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx&mode=its)中给出的数据。我试图使用BeautifulSoup,但看起来,它没有看到标签。在下面的代码Python BS4与SDMX
import urllib2
from bs4 import BeautifulSoup
url = "https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx"
html_source = urllib2.urlopen(url).read()
soup = BeautifulSoup(html_source, 'lxml')
ts_series = soup.findAll("bbk:Series")
这给了我一个空的对象。
是BS4错误的工具,或者(更可能)我做错了什么? 在此先感谢
提供的网址显示“您的请求无法处理!”,也许只是粘贴一些XML片段会有帮助。 – flyingfoxlee
<?XML版本= “1.0” 编码= “UTF-8”?> 步步高:数据集> CompactData> 不知道如何将它正确格式化这里。对不起 –
Daniel
你说得对,但url在Python中是可读的,至少在我的系统上 – Daniel