beautifulsoup

    0热度

    1回答

    from bs4 import BeautifulSoup from selenium import webdriver import urllib2 import time driver = webdriver.Chrome() driver.maximize_window() driver.get("https://www.zillow.com/homes/recently_so

    0热度

    1回答

    我有两个<tr>标签在同一div类。第一个tr标签打印文本就好了。我试图访问容器中的第二个tr标签,但我似乎无法使其工作。另请注意,并非所有容器都有第二个<tr>标签,所以我需要一个if语句来检查它是否存在。如果是,则从中打印文本。谢谢! page_soup = soup(page_html, "html.parser") containers = page_soup.findAll("div

    0热度

    2回答

    我在下面的HTTPS URL处有一系列XML文件。我需要从URL中获取最新的XML文件。 我试图修改这段代码,但不起作用。请帮忙。 from bs4 import BeautifulSoup import urllib.request import requests url = 'https://www.oasis.oati.com/cgi-bin/webplus.dll?script=/

    1热度

    2回答

    样本HTML <div class="SomeClass" style="">some text<\div> 为了找到这个特定的标签i`ve试图 text = article.find('div', attrs={'style':""}) 但它找到的所有标记那些有这个属性,不管空。 如何指定标签“div”必须有一个空的“样式”属性? (修订版)找到了解决办法,但它看起来有点丑 text_a

    0热度

    1回答

    这是获取餐馆评论的代码。我正在收集评论。 指定并导入范围。但有一个问题。每家商店都有不同数量的评论。很少有评论的商店应该很快去下一个商店。 我受到的范围太大。但它不能缩小范围。这是因为一些商店在这个范围内有评论。 我该如何有效地工作? 我看到了所有?(元素)搜索此代码。但我不知道我是否错误地应用了我的代码。 #python3 import sys from bs4 import Beautif

    0热度

    1回答

    我在Python 2.7.13上使用BS4来解析来自网站的论坛帖子,我最终将其放入CSV文件中。我的问题是只有线程中的第一篇文章有​​关于线程标题的数据,但我希望文章的标题出现在我创建论坛帖子的CSV文件的每一行中。每行应该有帖子标题,帖子的作者,帖子日期和时间以及帖子的内容。当我搜索作者,日期/时间和内容时,我会收到与页面中一样多的结果,因此在本例中为19。所以CSV文件中应该有19行。但是,我

    0热度

    1回答

    我有一个特定的网站,我试图频繁地刮。我抓取了所有我想要的内容,但是,在soup.find_all中有太多项目(即使尝试使用'span'和class_ =指定)。 a = soup.find_all('span', class_=re.compile("headline") 其中LEN(A)= 500如何可以编程逻辑,使得我只能抓住前10个标题,而不是500?看起来像抓住所有500人正在导致我的

    1热度

    1回答

    我已经编写了一个代码,可以从网页中删除一些细节。我的问题是,每当我运行我的代码时,它会打印出如下输出: | ['Kapil Sarawagi''[email protected]''1412702594'] | | ['MA ARCHICTECTS PRIVATE LIMITED''[email protected]''1414299999'] | | ['Prabhu Dayal Kanojiy

    0热度

    2回答

    我正在使用beautifulsoup获取页面中的所有链接。我的代码是: import requests from bs4 import BeautifulSoup url = 'http://www.acontecaeventos.com.br/marketing-promocional-sao-paulo' r = requests.get(url) html_content = r

    1热度

    1回答

    我的目的是为输入中搜索的视频制作一个文件所有代码波纹管的作品,但我找不到如何搜索HTML代码或写它到一个html文件)。最终目标是让YouTube不一致的机器人在本地工作。我需要提取用于嵌入视频的代码,而无需手动右键单击视频。 我会很感激那些谁帮忙:) import bs4 as bs import urllib.request import os basic = 'https://w