urllib

0热度

1回答

我正在编写一个简单的脚本，在LinkedIn上无需登录即可看到公开的个人档案。下面是我的代码来获取美丽的页面。我也使用公共代理。 import urllib.request, urllib.error from bs4 import BeautifulSoup url = "https://www.linkedin.com/company/amazon" proxy = urllib.r

0热度

1回答

我想检索特定行上的html标记内的文本

我正在使用html.parser和urllib.request。我不打算使用任何非本地模块，但如果有必要，我愿意使用其他本地模块。目前（的一部分），我的代码如下所示： class MyHTMLParser(HTMLParser): def handle_data(self, data): if self.getpos()[0] == 167: print(se

0热度

1回答

使用urlretrieve（）将子文件下载到子文件夹

是否可以使用urlretrieve()将某些内容下载到子文件夹中而不以绝对但相对的方式表达它？例如： urllib.request.urlretrieve(url, '/downloads/2017/foo.txt') 每次我添加路径文件名蟒蛇抛出以下错误： File "C:\Program Files\Python36\lib\urllib\request.py", line 258, i

0热度

1回答

在Python中的POST方法：errno 104

我想在Python中查询网站。我需要使用POST方法（根据当我使用开发人员工具监视它时浏览器中发生的情况）。如果我查询与卷曲的网站，它工作得很好： curl -i --data "param1=var1¶m2=var2" http://www.test.com 我得到这样的标题： HTTP/1.1 200 OK Date: Tue, 26 Sep 2017 08:46:18 GMT

1热度

1回答

我如何获得代码嵌入从YouTube使用的YouTube视频3.6

我的目的是为输入中搜索的视频制作一个文件所有代码波纹管的作品，但我找不到如何搜索HTML代码或写它到一个html文件）。最终目标是让YouTube不一致的机器人在本地工作。我需要提取用于嵌入视频的代码，而无需手动右键单击视频。我会很感激那些谁帮忙:) import bs4 as bs import urllib.request import os basic = 'https://w

0热度

1回答

格式化urllib的编码输出quote_plus

我有一个字符串列表。 category_list = "[u'Automation', u' Card Readers & POS']" 现在，我执行下述操作 category_list = urllib.quote_plus(category_list, safe=':/'.encode('utf-8')) 我的编码数据发布到网络和在解码列表的输出格式是这样的下方。 [u\'A

1热度

2回答

Python- urllib.urlencode：解析字典项放入字符串

我需要字典项编码这样 data = OrderedDict([('mID', ['54a309ae1c61be23aba0da54', '54a309ae1c61be23aba0da63'])]) 成格式化这样 mID=[54a309ae1c61be23aba0da54,54a309ae1c61be23aba0da63] 当我使用url_values = urllib.urlencode(

0热度

1回答

刮去本地加载的图像

我正在学习美丽的汤，并试图抓取从本地目录上传的图像时遇到问题。我看到的错误是： ValueError: unknown url type: 'images/ixa2.png' 我认为正在发生的事情是图像从本地目录中加载并没有被通过URL托管。这是个什么样子，当我检查，我试图刮元素，如： <img width="200" align="left" hspace="0" src="ixa/card

2热度

1回答

如何获得不是使用python的广告的Google搜索的第一个结果？

我正在尝试将一群澳大利亚公司的财务报表作为pdf。我有存储在大熊猫数据帧中的所有公司，他们的公司名称是在一个名为列“公司”这是我到目前为止的代码搜索的网址： import webbrowser tabUrl = "http://google.com/?#q=" append = "+financial+report+2017" file_type = 'filetype%3Apdf+'

1热度

1回答

tar文件无法打开TGZ

我试图从本网站下载TGZ文件： https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo07 这里是我的脚本： import os from six.moves import urllib import tarfile spam_path=os.path.join('ML', 'spam') root_download='https://