beautifulsoup

    1热度

    1回答

    import requests from bs4 import BeautifulSoup youtube = "https://www.youtube.com/results?search_query=" def get_address(keyword): query = youtube + keyword source_code = requests.get(qu

    2热度

    1回答

    我试图从获得“收益公告表”:https://www.zacks.com/stock/research/amzn/earnings-announcements 我使用不同beautifulsoup选项,但没有得到该表。 table = soup.find('table', attrs={'class': 'earnings_announcements_earnings_table'}) tabl

    0热度

    1回答

    [免责声明]我已经通过了该地区的其他许多答案,但他们似乎并不适合我。 我想能够导出我已经抓取的数据作为CSV文件。 我的问题是如何编写将数据输出到CSV的代码片段?从代码 目前代码 import requests from bs4 import BeautifulSoup url = "http://implementconsultinggroup.com/career/#/6257" r

    0热度

    2回答

    <div class="box_content row"> <br/> <h3 class="nomargin">Historial del aviso</h3> <br/> <ul> <li style="display:inline;margin-right:30px;"> <b>Actualizado:</b> <span> 31 08</span> </li>

    2热度

    6回答

    我对从古腾堡下载的大量小说进行了一些文本分析。我想保留尽可能多的元数据,所以我正在下载html,然后转换为文本。我的问题是从html文件中提取元数据,特别是每个小说的标题。 截至目前,我正在使用BeautifulSoup来生成文本文件并提取标题。对于简爱的示例文本,我的代码如下: from bs4 import BeautifulSoup ### Opens html file html =

    1热度

    1回答

    我刮了一个网站,并将结果存储在嵌套字典中。 该字典与我的数据库具有相同的结构。 我的目标是编写一个带有一个参数的函数,该参数保存表名,并将字典中的数据插入该表中。 我有以下代码 url = requests.get("http://www.randomurl.com") data = url.text soup = BeautifulSoup(data, "html5lib") cnx =

    -2热度

    1回答

    我想从this 2017 marathon获取每个跑步者的信息。问题是,要获得我想要的信息,我必须点击每个跑步者的名字才能获得他的partial splits。 我知道我可以使用get请求来获取每个跑步者的信息。例如,对于跑步者Josh Griffiths,我可以使用request.get使用url中的参数。 我的问题是,我不知道如何找出idp这个术语,因为这个术语随着每个跑步者而改变。 我的问题

    -2热度

    1回答

    如果用户需要歌曲的歌词,我想创建一个从网站收集简单文本的简单程序,该如何让程序收集它。 https://www.azlyrics.com/lyrics/runthejewels/closeyoureyesandcounttofuck.html 如何从本网站收集歌词部分?

    0热度

    1回答

    <a href="/apartamento-en-venta/bogota/nicolas_federman-det-2658430.aspx" title="Apartamento en Venta - Bogotá Nicolás de Federmán"> <div> <h2 class="h2-grid"> Apartamento en Bogotá -

    -1热度

    1回答

    我使用 from selenium import webdriver browser = webdriver.Firefox() 打开Firefox和刮JavaScript的数据。 有没有办法打开Firefox与安装的插件,因为现在它使用“干净”安装没有任何插件?