beautifulsoup

    0热度

    1回答

    我正在为包含数学常量的网页开发Web解析器。我需要替换一些字符才能使其具有特定格式,但我不知道为什么如果我打印它,我似乎工作正常;但是当我打开输出文件时,replace()所实现的格式似乎不起作用。 这是代码 #!/usr/bin/env python3 from urllib.request import urlopen from bs4 import BeautifulSoup ur

    0热度

    2回答

    我正在学习使用python进行网页抓取,但无法获得所需的结果。下面是我的代码和输出 代码 import bs4,requests url = "https://twitter.com/24x7chess" r = requests.get(url) soup = bs4.BeautifulSoup(r.text,"html.parser") soup.find_all("span",{"c

    1热度

    1回答

    我想下面的代码读取从雅虎财经的历史CSV数据读取网址: import datetime import time from bs4 import BeautifulSoup per1 = str(int(time.mktime((datetime.datetime.today() - td(days=365)).timetuple()))) per2 = str(int(time.mkt

    0热度

    1回答

    对家庭作业的工作,我有“doc.html”文件与数据: <span class="descriptor">Title:</span> Automated Scalable Bayesian Inference via Hilbert Coresets <span class="descriptor">Title:</span> PASS-GLM: polynomial approximate s

    1热度

    1回答

    我正在使用Beautifulsoup对表格元素进行更改。更具体地说,我正在向tbody和td元素添加一个类。这很好,但只适用于第一个匹配元素。我无法弄清楚如何迭代页面上其余的匹配元素。 soup = BeautifulSoup(combine_html, "html.parser") soup.find('tbody')['class'] = 'list' soup.find('td')['c

    -1热度

    1回答

    我装盘从以下HTML脚本报废“产品技术含量的部分行”类下的div嵌套实例: <h2 class="product-tech-section-title"> Présentation de la TV SAMSUNG UE49MU9005</h2> <div class="product-tech-section-row"> <div> Désignation</

    1热度

    1回答

    我一直在尝试使用python requests模块在网页上抓取网站,并且需要登录到站点以检索我想要的数据。我环顾四周,但不知道为什么它不工作。这是我到目前为止的代码: import requests import bs4 as bs login_url = "__withheld__" target_url = "__withheld__" login_data = { "userna

    0热度

    1回答

    <div class="t m0 x1c h4 y10f ff2 fs2 fc0 sc0 ls0 ws0"> Kne e <span class="_ _72"> </span> <span class="ff3"> 102.2° <span class="_ _8"> </span>

    2热度

    1回答

    我目前正在尝试使用硒和BeautifulSoup从网站检索所有iframe标签。问题是我没有得到所有的内置页框,因为BS4没有搜索到网页内有内部html文档,我不相信JavaScript在HTML内执行,所以可能有一些HTML元素不是得到渲染。是否有一个网络抓取工具,可以让我请求一个url,检索完整的js呈现的HTML文件,然后搜索DOM并获取与iframe匹配的所有标签,即使在内部HTML代码中

    -1热度

    1回答

    我试图从页面中提取一个div元素。我使用“类”来识别该标签。但它没有检测到div标签。它显示一个空列表。我附上下面的代码的图像。