urlopen

    1热度

    1回答

    我正在尝试编写一个Python程序来处理RSS,但是我有一些问题直接从互联网。 我正在使用urllib.request.urlopen()来获取文件。这里是一个我有故障码位: import xml.etree.ElementTree as et import urllib.request as urlget self.sourceUrl = sourceUrl #sourceUrl was

    2热度

    2回答

    我试图刮去谷歌专利的一些数据,和我的代码的开头是这样的:(here是超链接,下面列出的URL) In [1]: import urllib2 In [2]: url='http://www.google.com/search?tbo=p&q=ininventor:\"{}\"&hl=en&tbm=pts&source=lnt&tbs=ptso:us'.format('John-Mudd')

    1热度

    2回答

    今天早些时候,我能拉下面 import urllib2 url = 'http://www.google.com/search?tbo=p&q=ininventor:"John-Mudd"&hl=en&tbm=pts&source=lnt&tbs=ptso:us' req = urllib2.Request(url, headers={'User-Agent' : "foobar"})

    0热度

    1回答

    我希望你能告诉我我的webscraper出错的地方。 我想要做的是在页面上某个字符串(“Sorry,Gruen Fan”)发生变化时收到通知。我能够拉入字符串,但是,“If”函数似乎不起作用 - 它的输出应该是“Text in in”。下面的代码: from bs4 import BeautifulSoup from urllib import urlopen import re urls

    0热度

    3回答

    我试图用shutil/urlopen下载图像,因为不推荐?我不确定它是否被弃用,但urlretrieve不下载该文件,它只是创建映像名称的文件夹。看过其他问题后,我看到一个提供此代码的问题,但是我也发现了一个错误。 from urllib2 import urlopen from shutil import copyfileobj url = 'http://www.watchcartoo

    0热度

    1回答

    我是Python和Django的总新手,并且正在通过http post传递数据到一个简单的web应用程序。我浏览了Django教程,对于教授的内容有了很好的理解,但我并没有将urls.py正则表达式滤掉。我已成功使用urlopen()作为http get。将它用于POST不太成功。看起来好像我的app urls.py(不是项目urls.py)不允许POST进入我的应用程序views.py。非常有意

    -1热度

    1回答

    cj=http.cookiejar.CookieJar() opener=build_opener(HTTPCookieProcessor(cj)) data={'uid' : uid , 'password' : password } #uid is username to the website data=urllib.parse.urlencode(data) data=data.e

    1热度

    2回答

    我试图抓住显示供应商和特定产品的价格的产品列表页面,但urllib.urlopen不工作 - 它将在亚马逊上的所有其他页面上工作,但我有点想知道亚马逊的机器人可以防止在产品列表页面上进行刮擦。任何人都可以验证此?使用Chrome我仍然可以查看网页源... 这里有一个产品列表网页的一个例子,我想凑:http://www.amazon.com/gp/offer-listing/B007E84H96/r

    0热度

    2回答

    我需要经常从形式的网站,获取并解析XML数据: https://api.website.com/stuff/getCurrentData?security_key=blah 我不能发布安全的,因为实际的连接数据的性质。当我把这个URL放到我的浏览器(Safari)中时,我返回了XML。 当我通过urllib2调用它时,我得到垃圾。 f = urllib2.urlopen("https://ap

    1热度

    1回答

    我真的很努力地研究如何打印到列表。我想打印我指定的URL的服务器响应代码。你知道我怎么改变代码打印输出到列表中?如果不是,你知道我在哪里可以找到答案吗?我现在一直在寻找几个星期。 下面的代码: import urllib2 for url in ["http://stackoverflow.com/", "http://stackoverflow.com/questions/"]: t