beautifulsoup

1热度

1回答

为什么我不能调用container.findAll（“h3”，{“class”：“name”}）？

我想要的只是刮去所有的产品。为什么我也不能使用containers.div？当我的教程只有<div></div>时，我很困惑<div><\div><div>。 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup my_url = 'https://hbx.com/categories

0热度

1回答

无法抓取Reddit的NBA页面

我是网络爬虫的新手，想要学习如何使用beautifulsoup将其集成到迷你项目中。我在他的youtube channel上关注美丽的新教程，然后就试图抓取Reddit。我想在Reddit/r/nba的每个NBA新闻中抓取冠军和链接，但没有取得任何成功。只有在终端返回的是“处理完成退出码0”。我有一种感觉，这是与我的选择？任何指导和帮助将不胜感激。这是原来的代码，没有工作： import req

3热度

1回答

BeautifulSoup - 对结果集

添加属性，这里是我的HTML结构凑： <div class='schedule-lists'> <ul> <li>...</li> <ul> <li>...</li> <ul class='showtime-lists'> <li>...</li> <li><a auditype="N"

1热度

1回答

解析HTTP返回断开链路

我'试图从一些电报信道解析图像，如实施例https://t.me/versusbattlerus，该图像是该块上 “IMG类=” tgme_page_photo_image” SRC =‘HTTPS：// ...’，但每次方法返回不同的，而不是建立工作联系，为什么会这样使用python 3.6，urllib的？我'，beautifulsoup4 方法 import urllib.request

0热度

2回答

python3访问带索引的bs4元素的行

我有一个bs4对象，并使用findAll和find_next_sibling来选择它的一部分。从这个部分我称之为“兄弟”我访问每一行与一个循环是这样的： for cursor in sibling: index = sibling.index(cursor) print(index) # works until here next_cursor = sibling

0热度

1回答

获取Qualtrics图形URL

继续解释代码here，我想在Qualtrics图形库中抓取一系列图形的URL。但that question中提供的代码似乎不起作用。我有一个具体的问题，为什么这是一个直觉：问题：如果我手动浏览到的照片库中，然后运行该代码的其余部分（如指示中的说明），我得到一个消息说这 name 'driver' is not defined 我有种解决了这个使用time.sleep(20)并利用上述暂停登录

2热度

1回答

在网页搜索期间修改HTML内容

我尝试做一些网页搜刮目的是根据邮政编码收集所有的补救措施。问题是当我尝试我的代码时，我的列表是空的，因为url根据邮政编码没有改变。这就是为什么我想在修改过程中更改HTML值的原因。我不知道如何做到这一点。我尝试使用Selenium和XPATH但是我无法找到任何东西。这里的HTML代码：（红色是我需要改变。）编辑：的确，我们的目标是根据邮政编码来收集与名称的分页和补救的类型，这这就是为什么

2热度

4回答

登录到Instagram的使用python

我试图登录到instagram.Here是我的代码 from bs4 import BeautifulSoup from requests import * payload = { 'action': 'login', 'username': 'name', 'password': 'pass' } with session() as c: c.p

1热度

2回答

Beautifulsoup - findAll找不到字符串，当链接也在容器中

我使用findAll函数在beautifulsoup中刮取文本的网页并将结果返回到列表中。出于某种原因，当td容器中还存在链接时，它不会返回条目。例如： <html <tr> <td> Taken at. string without link, this is found </td> </tr> <tr> <td> Taken at. string followe

0热度

1回答

当我打电话使用<code>soup.select('img[data-image-large]')</code>我不能让所有的图像使用美丽的汤和硒

属性我真的不知道如何从data-image-large得到公正的src图像我得到这个： [<img alt="Adidas Originals NMD C2" class="img-responsive" data-image-large="https://hypebeast.imgix.net/http%3A%2F%2Fs3.store.hypebeast.com%2Fmedia%2Fimage