urllib

    0热度

    2回答

    我在抓取点击列表时遇到问题。 每年在某个网页上都有一个具有特定网址的匹配列表。该网址包含年份,所以我想用命中列表为每年制作一个csv文件。 可惜我不能让它顺序,我得到以下错误: ValueError: unknown url type: 'h' 这里是我尝试使用的代码。我很抱歉,如果有简单的错误,但我是pyhon的新手,我无法找到任何顺序在论坛适应这种情况。 import urllib im

    -1热度

    1回答

    我想下载,有一个表,在一个单元格,多个项目的单元格。 我得到三个问题: 的曲目列表列不正确生成(它是在下面一行insted的OT了同一行的其他数据类型(如写在标题]);在最近 歌曲列(曲目列表)没有被嵌入在一个细胞,我无法找到一个方法来摆脱多行格式化; 下载停止在1990年的一年错误 "UnicodeEncodeError: 'charmap' codec can't encode charact

    0热度

    1回答

    所以,我最近一直在用python冒险,而且我一直在尝试通过混合我发现和创建的代码来学习一些东西它将成为我未来可能最终使用的东西。我已经几乎完全的项目,虽然当我打印出来的链接,它说的是这样的事情,我宁愿 https://v3rmillion.net/showthread.php 而不是: https://v3rmillion.net/showthread.php?tid=393794 import

    -1热度

    1回答

    我正在尝试在Python 3中创建一个网页抓取工具。我不断收到WinError 10060,指出连接失败,因为连接方没有正确响应,或者连接的主机未能响应。同时使用urllib和尝试请求库都会创建10060错误。在使用请求时,错误指出它们超出URL的最大重试次数。 import urllib.request with urllib.request.urlopen('http://python.o

    1热度

    1回答

    我是相当新的Python和我试图使一个股票应用程序网络分析器。我基本上使用urllib在参数列表中打开每个股票所需的网页,并阅读该页面的html代码的完整内容。然后,我正在切片,以便找到我正在寻找的报价。我实施的方法有效,但我怀疑这是实现这一结果的最有效方法。我花了一些时间研究其他潜在的更快速读取文件的方法,但似乎没有涉及网络抓取。这里是我的代码: from urllib.request impo

    0热度

    1回答

    所以,我有一个使用BS4抓取一些链接出来,然后我愿意下载这些链接,但问题是,当我点击下载按钮,浏览器会自动启动刮板要下载链接间接指向的zip文件,但是当我给与urllib相同的链接时,它总是会下载页面而不是zip文件! 我刮出来的链接是:Link I got from scraping 链接到我报废了该链接的页面:Main Page 在链接此主页具有文本“4931x” 现在,当我点击相同的链接通过

    0热度

    2回答

    我正在使用包urllib和urllib.request的简单代码是downloading a file over HTTP。除了我希望能够处理可能发生的网络问题之外,一切工作都很好。 检查计算机是否在线(连接到Internet)。只有在正确的情况下才能继续。 重新启动文件的下载,如果在此期间,连接丢失或太糟糕。 我想,如果可能的话,使用尽可能少的软件包。 这里是我的实际代码: import url

    0热度

    2回答

    我正在努力做一些简单的单词/判刑。 尝试这样: import urllib from urllib import request url = "https://fotka.com/profil/k" word = "Nie ma profilu" def search_website(url, word): page = urllib.request.urlopen(url) p

    1热度

    1回答

    我有一个Python 3中 http服务器下面的代码解析出一个URL,然后解析出一个查询字符串: parsedURL = urlparse(self.path) parsed = parse_qs(parsedURL.query) 说在这种情况下parsedURL.query将变为x=7&=3。我想要得到7和3出来,并将它们设置为变量x和y。我都试过 x = parsed['x'] y =

    1热度

    2回答

    新来美丽的汤4,当我在YouTube上搜索某些东西时,我无法获取这个简单的代码来获取标签的内容。当我打印容器时,它只是打印“[]”作为我假设的一个空变量。任何想法,为什么这不是挑选什么?这是否与不在YouTube上抓取正确的标签?在搜索HTML有一个结果如下标签: <a id="video-title" class="yt-simple-endpoint style-scope ytd-video