urllib

    0热度

    1回答

    现在我有这样的代码tenatively: import json import urllib2 with open('proxies.txt') as proxies: for line in proxies: proxy = json.loads(line) proxy_handler = urllib2.ProxyHandler(proxy)

    0热度

    1回答

    我希望你能告诉我我的webscraper出错的地方。 我想要做的是在页面上某个字符串(“Sorry,Gruen Fan”)发生变化时收到通知。我能够拉入字符串,但是,“If”函数似乎不起作用 - 它的输出应该是“Text in in”。下面的代码: from bs4 import BeautifulSoup from urllib import urlopen import re urls

    2热度

    3回答

    对于一个班级,我有一个练习,我需要计算任何给定网页上的图片数量。我知道每张图片都以图片开头,因此我正在使用正则表达式来尝试找到它们。不过,我不断收到一个计数我知道是错的,什么是错我的代码: import urllib import urllib.request import re img_pat = re.compile('<img.*>',re.I) def get_img_cnt(u

    0热度

    2回答

    我是新来张贴到堆栈,但一直使用此网站来解决大量的编码问题,所以我知道一些基本知识。我已经尝试了几个小时(在一个问题上这对我来说很重要)来解决这个问题。我正在创建一个本地工具(HTA)来最终管理CSV文件,但是我被困在第一部分。 我正在创建一个资源管理器类型选择工具,您可以在其中选择根文件夹,它将加载每个子文件夹作为按钮,除非子文件夹中有一个空间,它会将其“吐出的字符串常量”排除在外。我已经解决了大

    0热度

    1回答

    眼下是这样的脚本: import json import urllib2 with open('urls.txt') as f: urls = [line.rstrip() for line in f] with open('proxies.txt') as proxies: for line in proxies: proxy = json.loads(l

    0热度

    2回答

    以下代码是非异步代码的示例,有没有什么方法异步获取图像? ​​ 我也看到了Grequests库,但我想不出太多,如果这是可能的,或者如何从文档做到这一点。

    1热度

    1回答

    我想加载一个YouTube页面,并获取<embed>元素,如下所示。但是,无法找到嵌入元素(soup.find('embed')返回None)。 import urllib import urllib2 from bs4 import BeautifulSoup import mechanize YT_URL = 'http://www.youtube.com/watch' vidId

    0热度

    3回答

    我有这长长的URL列表,我需要检查响应代码,其中的链接重复2-3次。我编写了这个脚本来检查每个URL的响应代码。 connection =urllib.request.urlopen(url) return connection.getcode() 的URL来在XML这种格式 < entry key="something" > url</entry> < entry key="someth

    1热度

    1回答

    我有Python代码转换使用github API降价。 gfm.py(蟒蛇3码)以下使用 import traceback import json import urllib.request import http.client import sys try: content = open(sys.argv[1], 'r').read() data = {"text

    0热度

    2回答

    我想获得给定子网上所有主机的MAC地址。到目前为止,我通过ping所涉及的所有ips来强制更新arp表。之后,我查询ARP表,一切都很好。 问题是如何提高更新速度。在iPhone 3GS上Ping 65000个地址大约需要15分钟。即使我不等待回应正在发生。这是很长的路要走。 这可能是我的ping代码中存在一个错误,它会降低速度,但目前我找不到任何东西。 我的问题是: 是否有更快的网络操作触发ar