beautifulsoup

1热度

2回答

我试图让BS4过滤元素出包含某个类。这里是我的HTML：  <html> <head> <title>Test</title> </head> <body> <table> <tr class='test hidden'><td>foo</td></tr> <tr class='testabc'><

0热度

1回答

如何从两个html页面提取数据？

我想从两个html页面提取数据。当我从一个页面提取数据并转到另一个页面时，某些元素会发生更改，数据会出现在列表和列表更改中。我下面的问题 details_containers = soup_page.findAll("div",{"id":"RESTAURANT_DETAILS"}) details_container = details_containers[0].findAll(

3热度

1回答

只能通过id找到，而不能通过班级找到BeautidulSoup4（Python3.x）

我是BeautifulSoup4的新手，并且遇到了一个似乎很基本的问题。我只能通过身份证找到，但不能按班上课。例如，我在看它有HTML在它下面的部分站点：现在，以下工作： page_soup.findAll('div', {'id': 'page-content'}) 而下面发现什么： page_soup.findAll('div', {'class': 'main-container'})

0热度

1回答

无法使用Python美丽的汤刮特定的网站

我一直在尝试使用BS刮这个网页，但无济于事。任何人都可以帮我吗？我不确定这个网页有什么问题，或者我的代码有问题。 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup my_url = "https://www.cea.gov.sg/Custom/CEA/PublicRegister/Page/Pub

2热度

2回答

多检查“无” - 这将是在Python

有道我使用BeautifulSoup解析HTML，我经常发现我自己用下面的代码： result.find("some_tag").attrs['some_attribute'] 什么是正确的方法验证find方法是否没有返回None并且还检查没有嵌套的“if”语句的属性中是否有这样的键？感谢

0热度

1回答

无法从基于JavaScript的网页

我试图取出从链接目前针对“文件会计期间为关注焦点”的季度值获取数据：https://www.sec.gov/cgi-bin/viewer?action=view&cik=40545&accession_number=0000040545-14-000049&xbrl_type=v# 当我看网页的烃源就说明下面标记为这个信息： <li class="accordion" id="r1" ><a cl

0热度

1回答

在Python 3.0中使用Beautiful Soup获取特定链接的最有效方法是什么？

我目前在coursera上学习Python专业。我遇到了使用BeautifulSoup从网页中提取特定链接的问题。在这个网页（http://py4e-data.dr-chuck.net/known_by_Fikret.html）中，我应该从用户输入中提取一个URL并打开后续链接，所有后续链接都通过锚定标签标识并运行一些迭代。虽然我能够使用列表对它们进行编程，但我想知道是否有没有使用列表或字典的简

0热度

1回答

如何从大多数网站获取推特链接 - Python

我正在构建一个网络爬虫，它可以扫描网站以查找推特链接。我是新来的美丽的汤，我很难过。我曾尝试使用正则表达式来解析页面的整个HTML，但这种方法的效果不及美丽的汤。目前我的代码抓取一个网站，并试图解析它的Twitter网址。当然，我知道这不会总是有效，但现在一切都会返回为None，并且永远不会返回Twitter链接，但我知道这些网站包含它们。进一步，一旦有5个链接我一般也收到错误： Attribu

0热度

2回答

如何在python中删除特定文本BeautifulSoup

在此我只想报废Vishakhapatnam - Ankapalli [Km 2.837 to & Km; 395.870至Km358.00（新桩号从公里700.544公里至740.255），那么如何取消这个，请帮助 <p><b><lable style="color:#3097b0;"> Aganampudi (Public Funded) </lable></b> <br/>Km 728.055

1热度

1回答

无法将网址放入列表（BeautifulSoup）

我想提取所有的网址，并将所有这些网址放入列表中。但是，当我运行代码时，它显示一条错误消息："tag[key] returns the value of the 'key' attribute for the tag, and throws an exception if it's not there."我想知道如何解决此问题。我的代码如下： import urllib.request from