urlopen

0热度

3回答

我正在从网址中抓取简单的文本文件。 def scrape_contents_ex(url): data = urllib2.urlopen(url) return data.read() 的问题是，它产生被阻塞新行和制表符 “\ t” 的， “\ R” 等字符串实施例：这里是网页当我用python打印字符串输出时，它用各种\字符呈现：我不知道如何正确处理从urlop

1热度

1回答

mp3下载urllib.request.urlopen（）超时

我有一个名为href_w与一群MP3下载链接的列表，但是当我执行这段代码，它给了我一个错误： # Download file print(color.BLUE + "\n[*] Downloading requested mp3(s) ..." + color.END) for link in href_w: url = "http://www.mp3c.cc"+link.repla

0热度

1回答

Urllib和BeautifulSoup灵活的urlopen（）选项

你们对我最后一个问题都非常有帮助，所以我虽然会提出一个关于我一直面临的问题的新问题。我导入了BeautifulSoup，并试图从本网站的医学院数据库导出数据：https://services.aamc.org/msar/home。我创建了一个“for”循环来打开和解析网站，然后打印包含学校所在城市和州的特定范围的数据。执行代码后，我很兴奋地发现我的代码正在工作!!并且惊讶地发现它在第三次学校之后返

-1热度

2回答

urlopen with beautifulsoup for loop

新用户在这里。我是开始以获得Python语法的窍门，但不断被for循环抛出。我理解到目前为止所达到的每个场景（以及我之前的例子），但似乎无法为我当前的场景提出一个场景。我正在玩BeautifulSoup来从应用程序商店中提取功能作为练习。我创建了一个包含GooglePlay和iTunes网址的列表。 list = {"https://play.google.com/store/apps/det

0热度

1回答

urllib的HTTP错误403

我已经通过了论坛搜索，试图找出为什么下面的代码不工作： import nltk, re, pprint from urllib import request url = "http://www.gutenberg.org/files/2554/2554.txt" response = request.urlopen(url) raw = response.read().decode('ut

2热度

1回答

urllib.request.urlopen返回字节，但我不能对其进行解码

我试图解析使用urllib.request的urlopen()方法的网页，如： from urllib.request import Request, urlopen req = Request(url) html = urlopen(req).read() 然而，最后一行返回的结果以字节为单位。所以我试图对其进行解码，如： html = urlopen(req).read().deco

0热度

1回答

的Python：从URL

打开一些参考我的网址https://cars.mail.ru/reviews/renault/?year=2010-2016 和我应该开在那里 https://cars.mail.ru/reviews/renault/sandero_stepway/2015/143355/ https://cars.mail.ru/reviews/renault/sandero/2015/147850/ ht

0热度

1回答

Python 2.7版：写作输出到位于使用URL

我想测试一个简单的方式来写，从本地到一个文件运行Python脚本的消息（也可能不会在脚本的时候存在一个共享目录中的文件运行），可以托管在一个共享目录（即Dropbox链接）中，并且其路径由url指定。 1）收存箱只是选择作为一个例子，因为它是众所周知的，并且容易的。如果将最后一个dl = 0更改为dl = 1，我已经能够从共享目录中已存在的文件中检索内容。示例:(不使用真实链接）：我有书面一

0热度

1回答

避免使用Beautifulsoup和urllib.request下载图像

我正在使用BeautifulSoup（'lxml'解析器）与urllib.request.urlopen()以从网站获取文本信息。但是，当我在Acitivity Monitor中检查网络部分时，我看到python下载了大量数据。这表明不仅文本被下载，而且图像也被下载。当使用BeautifulSoup进行网页浏览时，是否可以避免下载图像？

4热度

2回答

导入错误：无法导入名称的urlopen

我试图打开了一个网址为我的项目，这里是我的代码： from urllib2 import urlopen page = urlopen("https://docs.python.org/3/howto/urllib2.html") contents = page.read() 这只是一个演示一个简单的代码但是，当我运行代码，我得到了以下错误“导入错误：无法导入名称的urlopen” 我试着