urllib

    0热度

    1回答

    我正在编写一个简单的脚本,在LinkedIn上无需登录即可看到公开的个人档案。 下面是我的代码来获取美丽的页面。我也使用公共代理。 import urllib.request, urllib.error from bs4 import BeautifulSoup url = "https://www.linkedin.com/company/amazon" proxy = urllib.r

    0热度

    1回答

    我正在使用html.parser和urllib.request。我不打算使用任何非本地模块,但如果有必要,我愿意使用其他本地模块。 目前(的一部分),我的代码如下所示: class MyHTMLParser(HTMLParser): def handle_data(self, data): if self.getpos()[0] == 167: print(se

    0热度

    1回答

    是否可以使用urlretrieve()将某些内容下载到子文件夹中而不以绝对但相对的方式表达它? 例如: urllib.request.urlretrieve(url, '/downloads/2017/foo.txt') 每次我添加路径文件名蟒蛇抛出以下错误: File "C:\Program Files\Python36\lib\urllib\request.py", line 258, i

    0热度

    1回答

    我想在Python中查询网站。我需要使用POST方法(根据当我使用开发人员工具监视它时浏览器中发生的情况)。 如果我查询与卷曲的网站,它工作得很好: curl -i --data "param1=var1¶m2=var2" http://www.test.com 我得到这样的标题: HTTP/1.1 200 OK Date: Tue, 26 Sep 2017 08:46:18 GMT

    1热度

    1回答

    我的目的是为输入中搜索的视频制作一个文件所有代码波纹管的作品,但我找不到如何搜索HTML代码或写它到一个html文件)。最终目标是让YouTube不一致的机器人在本地工作。我需要提取用于嵌入视频的代码,而无需手动右键单击视频。 我会很感激那些谁帮忙:) import bs4 as bs import urllib.request import os basic = 'https://w

    0热度

    1回答

    我有一个字符串列表。 category_list = "[u'Automation', u' Card Readers & POS']" 现在 ,我执行下述操作 category_list = urllib.quote_plus(category_list, safe=':/'.encode('utf-8')) 我的编码数据发布到网络和在解码列表的输出格式是这样的下方。 [u\'A

    1热度

    2回答

    我需要字典项编码这样 data = OrderedDict([('mID', ['54a309ae1c61be23aba0da54', '54a309ae1c61be23aba0da63'])]) 成格式化这样 mID=[54a309ae1c61be23aba0da54,54a309ae1c61be23aba0da63] 当我使用url_values = urllib.urlencode(

    0热度

    1回答

    我正在学习美丽的汤,并试图抓取从本地目录上传的图像时遇到问题。我看到的错误是: ValueError: unknown url type: 'images/ixa2.png' 我认为正在发生的事情是图像从本地目录中加载并没有被通过URL托管。这是个什么样子,当我检查,我试图刮元素,如: <img width="200" align="left" hspace="0" src="ixa/card

    2热度

    1回答

    我正在尝试将一群澳大利亚公司的财务报表作为pdf。我有存储在大熊猫数据帧中的所有公司,他们的公司名称是在一个名为列“公司”这是我到目前为止的代码搜索的网址: import webbrowser tabUrl = "http://google.com/?#q=" append = "+financial+report+2017" file_type = 'filetype%3Apdf+'

    1热度

    1回答

    我试图从本网站下载TGZ文件: https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo07 这里是我的脚本: import os from six.moves import urllib import tarfile spam_path=os.path.join('ML', 'spam') root_download='https://