beautifulsoup

    1热度

    1回答

    我想要的只是刮去所有的产品。为什么我也不能使用containers.div?当我的教程只有<div></div>时,我很困惑<div><\div><div>。 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup my_url = 'https://hbx.com/categories

    0热度

    1回答

    我是网络爬虫的新手,想要学习如何使用beautifulsoup将其集成到迷你项目中。我在他的youtube channel上关注美丽的新教程,然后就试图抓取Reddit。我想在Reddit/r/nba的每个NBA新闻中抓取冠军和链接,但没有取得任何成功。只有在终端返回的是“处理完成退出码0”。我有一种感觉,这是与我的选择?任何指导和帮助将不胜感激。 这是原来的代码,没有工作: import req

    3热度

    1回答

    添加属性,这里是我的HTML结构凑: <div class='schedule-lists'> <ul> <li>...</li> <ul> <li>...</li> <ul class='showtime-lists'> <li>...</li> <li><a auditype="N"

    1热度

    1回答

    我'试图从一些电报信道解析图像,如实施例https://t.me/versusbattlerus,该图像是该块上 “IMG类=” tgme_page_photo_image” SRC =‘HTTPS:// ...’,但每次方法返回不同的,而不是建立工作联系,为什么会这样使用python 3.6,urllib的? 我',beautifulsoup4 方法 import urllib.request

    0热度

    2回答

    我有一个bs4对象,并使用findAll和find_next_sibling来选择它的一部分。从这个部分我称之为“兄弟”我访问每一行与一个循环是这样的: for cursor in sibling: index = sibling.index(cursor) print(index) # works until here next_cursor = sibling

    0热度

    1回答

    继续解释代码here,我想在Qualtrics图形库中抓取一系列图形的URL。但that question中提供的代码似乎不起作用。我有一个具体的问题,为什么这是一个直觉: 问题:如果我手动浏览到的照片库中,然后运行该代码的其余部分(如指示中的说明),我得到一个消息说这 name 'driver' is not defined 我有种解决了这个使用time.sleep(20)并利用上述暂停登录

    2热度

    1回答

    我尝试做一些网页搜刮 目的是根据邮政编码收集所有的补救措施。问题是当我尝试我的代码时,我的列表是空的,因为url根据邮政编码没有改变。这就是为什么我想在修改过程中更改HTML值的原因。 我不知道如何做到这一点。我尝试使用Selenium和XPATH但是我无法找到任何东西。 这里的HTML代码:(红色是我需要改变。) 编辑:的确,我们的目标是根据邮政编码来收集与名称的分页和补救的类型,这这就是为什么

    2热度

    4回答

    我试图登录到instagram.Here是我的代码 from bs4 import BeautifulSoup from requests import * payload = { 'action': 'login', 'username': 'name', 'password': 'pass' } with session() as c: c.p

    1热度

    2回答

    我使用findAll函数在beautifulsoup中刮取文本的网页并将结果返回到列表中。出于某种原因,当td容器中还存在链接时,它不会返回条目。例如: <html <tr> <td> Taken at. string without link, this is found </td> </tr> <tr> <td> Taken at. string followe

    0热度

    1回答

    属性我真的不知道如何从data-image-large得到公正的src图像我得到这个: [<img alt="Adidas Originals NMD C2" class="img-responsive" data-image-large="https://hypebeast.imgix.net/http%3A%2F%2Fs3.store.hypebeast.com%2Fmedia%2Fimage