beautifulsoup

0热度

1回答

我正在为包含数学常量的网页开发Web解析器。我需要替换一些字符才能使其具有特定格式，但我不知道为什么如果我打印它，我似乎工作正常;但是当我打开输出文件时，replace（）所实现的格式似乎不起作用。这是代码 #!/usr/bin/env python3 from urllib.request import urlopen from bs4 import BeautifulSoup ur

0热度

2回答

Web Scraping Python（BeautifulSoup，Requests）

我正在学习使用python进行网页抓取，但无法获得所需的结果。下面是我的代码和输出代码 import bs4,requests url = "https://twitter.com/24x7chess" r = requests.get(url) soup = bs4.BeautifulSoup(r.text,"html.parser") soup.find_all("span",{"c

1热度

1回答

使用BS4从雅虎金融

我想下面的代码读取从雅虎财经的历史CSV数据读取网址： import datetime import time from bs4 import BeautifulSoup per1 = str(int(time.mktime((datetime.datetime.today() - td(days=365)).timetuple()))) per2 = str(int(time.mkt

0热度

1回答

如何每一件事情标签后复制Beautifulsoup

对家庭作业的工作，我有“doc.html”文件与数据： <span class="descriptor">Title:</span> Automated Scalable Bayesian Inference via Hilbert Coresets <span class="descriptor">Title:</span> PASS-GLM: polynomial approximate s

1热度

1回答

BeautifulSoup - 如何迭代整个html页面来向每个页面添加一个类

我正在使用Beautifulsoup对表格元素进行更改。更具体地说，我正在向tbody和td元素添加一个类。这很好，但只适用于第一个匹配元素。我无法弄清楚如何迭代页面上其余的匹配元素。 soup = BeautifulSoup(combine_html, "html.parser") soup.find('tbody')['class'] = 'list' soup.find('td')['c

-1热度

1回答

BeautifulSoup不全患儿find_all

我装盘从以下HTML脚本报废“产品技术含量的部分行”类下的div嵌套实例： <h2 class="product-tech-section-title"> Présentation de la TV SAMSUNG UE49MU9005</h2> <div class="product-tech-section-row"> <div> Désignation</

1热度

1回答

Python Web抓取请求自动登录不工作

我一直在尝试使用python requests模块在网页上抓取网站，并且需要登录到站点以检索我想要的数据。我环顾四周，但不知道为什么它不工作。这是我到目前为止的代码： import requests import bs4 as bs login_url = "__withheld__" target_url = "__withheld__" login_data = { "userna

0热度

1回答

如何用美丽的汤解析嵌套标签？

2热度

1回答

从网站请求完全JavaScript呈现的html源代码，并找到所有iframe标签

我目前正在尝试使用硒和BeautifulSoup从网站检索所有iframe标签。问题是我没有得到所有的内置页框，因为BS4没有搜索到网页内有内部html文档，我不相信JavaScript在HTML内执行，所以可能有一些HTML元素不是得到渲染。是否有一个网络抓取工具，可以让我请求一个url，检索完整的js呈现的HTML文件，然后搜索DOM并获取与iframe匹配的所有标签，即使在内部HTML代码中

-1热度

1回答

BeautifulSoup不检索元素

我试图从页面中提取一个div元素。我使用“类”来识别该标签。但它没有检测到div标签。它显示一个空列表。我附上下面的代码的图像。