beautifulsoup

    1热度

    1回答

    我使用python 3.6和我能够用刮文字BeautifulSoup.I刮与沃尔玛website.I试图从沃尔玛刮文本练习。这是我的代码。 from bs4 import BeautifulSoup from urllib.request import urlopen main_page=urlopen('http://www.walmart.com/ip/Sceptre-32-Class-H

    1热度

    1回答

    我从一个URL爬取数据,并使用美丽的汤爬行。我想将抓取的数据作为blob存储到AZURE BLOB STORAGE中。下面是我的代码,当我将数据保存在本地时,我想要执行的直接上载到Azure中的数据。 soup = BeautifulSoup(urlopen('www.abc.html')) outfile = open('C:\\Users\\ADMIN\\filename.txt','w')

    0热度

    1回答

    import requests x=requests.get("http://www.ip-score.com/") import bs4 soup=bs4.BeautifulSoup(x.text,"lxml") x=soup.find("span",{"id":"spamhouse"}) print(x.getText()) 但它只是显示“” 即空字符串 但它应显示“清除”或“低

    0热度

    1回答

    我已经搜索了类似的问题,并给了它一些想法,但我是新来的python,似乎无法弄清楚这一点。我想凑这个网页上从播放器表中的数据: http://www.rotoworld.com/teams/depth-charts/mlb.aspx 每个条目(播放器)的HTML是例如: <td><b>3B</b></td><td>1. <a href='/player/mlb/6242/manny-machado

    0热度

    1回答

    输入URL http://py4e-data.dr-chuck.net/comments_42.html 当我运行这段代码,预期的输出是包含数字,是标签这是内部列表在程序中被解析。但我所得到的是列表中的最后一个数字。 请更正程序,以显示在所有标签目前号码的列表被解析 from urllib.request import urlopen from bs4 import BeautifulSoup

    1热度

    1回答

    请帮助我解决这个小问题。我正在寻找使用美丽的汤(Python)或python从SCRIPT标记(而不是Body)中的下面的代码中提取lat和lng值。我是Python新手,博客推荐使用美丽的汤来提取。 我想这两个值纬度:21.25335,经度:81.649445 我使用正则表达式这一点。我的正规表示“^ L([在])(:)([0-9])([^,] +)” 检查此链接为正则表达式和HTML文件 -

    1热度

    1回答

    我被困在试图从网站返回文本。我想从下面的例子中返回ownerId和unitId。任何帮助是极大的赞赏。 <script> h1.config.days = "7"; h1.config.hours = "24"; h1.config.color = "blue"; h1.config.ownerId = 7321; h1.config.locati

    2热度

    1回答

    Python非常新手,但我真的想学习它。当时我正在玩弄一个网站的数据,并且觉得我很接近想出解决方案。问题在于它只会返回url的第一个页面,即使通过代码中的url也会在每次迭代中更改页码。 我使用的网站是http://etfdb.com/etf/SPY/#etf-holdings&sort_name=weight&sort_order=desc&page=1,我试图刮具体的数据表是SPY控股(它说:

    1热度

    1回答

    希望这是一个容易的。我已经浏览了大部分与我的查询相关的有效帖子(并从每个代码片段中获取了代码片段),以便将其应用到我自己的代码中,但出于某种原因,我没有太多运气。 从本质上讲,我想要实现的是以下几点: 遍历上realestate.com第3页 - 出售价格 获取地址与出售价格 认沽值到熊猫DataFrame 如果我执行下面的块(没有URL循环),它适用于页1。我需要的是它通过前三页,并返回所有20

    0热度

    2回答

    我想解析HTML文件的 美丽的汤和Python一样 <h1>Title 1</h1> <div class="item"><p>content 1</p></div> <div class="item"><p>content 2</p></div> ... <h1>Title 2</h1> <div class="item"><p>content 3</p></div> <div cl