beautifulsoup

    1热度

    2回答

    我试图让BS4过滤元素出包含某个类。这里是我的HTML: <!-- language: lang-html --> <html> <head> <title>Test</title> </head> <body> <table> <tr class='test hidden'><td>foo</td></tr> <tr class='testabc'><

    0热度

    1回答

    我想从两个html页面提取数据。当我从一个页面提取数据并转到另一个页面时,某些元素会发生更改,数据会出现在列表和列表更改中。 我下面的问题 details_containers = soup_page.findAll("div",{"id":"RESTAURANT_DETAILS"}) details_container = details_containers[0].findAll(

    3热度

    1回答

    我是BeautifulSoup4的新手,并且遇到了一个似乎很基本的问题。我只能通过身份证找到,但不能按班上课。例如,我在看它有HTML在它下面的部分站点: 现在,以下工作: page_soup.findAll('div', {'id': 'page-content'}) 而下面发现什么: page_soup.findAll('div', {'class': 'main-container'})

    0热度

    1回答

    我一直在尝试使用BS刮这个网页,但无济于事。任何人都可以帮我吗?我不确定这个网页有什么问题,或者我的代码有问题。 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup my_url = "https://www.cea.gov.sg/Custom/CEA/PublicRegister/Page/Pub

    2热度

    2回答

    有道 我使用BeautifulSoup解析HTML,我经常发现我自己用下面的代码: result.find("some_tag").attrs['some_attribute'] 什么是正确的方法验证find方法是否没有返回None并且还检查没有嵌套的“if”语句的属性中是否有这样的键? 感谢

    0热度

    1回答

    我试图取出从链接目前针对“文件会计期间为关注焦点”的季度值获取数据:https://www.sec.gov/cgi-bin/viewer?action=view&cik=40545&accession_number=0000040545-14-000049&xbrl_type=v# 当我看网页的烃源就说明下面标记为这个信息: <li class="accordion" id="r1" ><a cl

    0热度

    1回答

    我目前在coursera上学习Python专业。我遇到了使用BeautifulSoup从网页中提取特定链接的问题。在这个网页(http://py4e-data.dr-chuck.net/known_by_Fikret.html)中,我应该从用户输入中提取一个URL并打开后续链接,所有后续链接都通过锚定标签标识并运行一些迭代。 虽然我能够使用列表对它们进行编程,但我想知道是否有没有使用列表或字典的简

    0热度

    1回答

    我正在构建一个网络爬虫,它可以扫描网站以查找推特链接。我是新来的美丽的汤,我很难过。我曾尝试使用正则表达式来解析页面的整个HTML,但这种方法的效果不及美丽的汤。目前我的代码抓取一个网站,并试图解析它的Twitter网址。 当然,我知道这不会总是有效,但现在一切都会返回为None,并且永远不会返回Twitter链接,但我知道这些网站包含它们。进一步,一旦有5个链接我一般也收到错误: Attribu

    0热度

    2回答

    在此我只想报废Vishakhapatnam - Ankapalli [Km 2.837 to & Km; 395.870至Km358.00(新桩号从公里700.544公里至740.255),那么如何取消这个,请帮助 <p><b><lable style="color:#3097b0;"> Aganampudi (Public Funded) </lable></b> <br/>Km 728.055

    1热度

    1回答

    我想提取所有的网址,并将所有这些网址放入列表中。但是,当我运行代码时,它显示一条错误消息:"tag[key] returns the value of the 'key' attribute for the tag, and throws an exception if it's not there."我想知道如何解决此问题。 我的代码如下: import urllib.request from