我想找到有关使用curl网页上的信息,但在Python,所以到目前为止,我有这样的:如何从Python脚本捕捉卷曲的输出
os.system("curl --head www.google.com")
如果我运行的是,它打印出:
HTTP/1.1 200 OK
Date: Sun, 15 Apr 2012 00:50:13 GMT
Expires: -1
Cache-Control: private, max-age=0
Content-Type: text/html; charset=ISO-8859-1
Set-Cookie: PREF=ID=3e39ad65c9fa03f3:FF=0:TM=1334451013:LM=1334451013:S=IyFnmKZh0Ck4xfJ4; expires=Tue, 15-Apr-2014 00:50:13 GMT; path=/; domain=.google.com
Set-Cookie: NID=58=Giz8e5-6p4cDNmx9j9QLwCbqhRksc907LDDO6WYeeV-hRbugTLTLvyjswf6Vk1xd6FPAGi8VOPaJVXm14TBm-0Seu1_331zS6gPHfFp4u4rRkXtSR9Un0hg-smEqByZO; expires=Mon, 15-Oct-2012 00:50:13 GMT; path=/; domain=.google.com; HttpOnly
P3P: CP="This is not a P3P policy! See http://www.google.com/support/accounts/bin/answer.py?hl=en&answer=151657 for more info."
Server: gws
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Transfer-Encoding: chunked
我想要做的,是能够使用正则表达式(我不需要与帮助)在它的200匹配,但是,我不能找到一种方法,所有的文本转换上面放入一个字符串。我怎么做? 我试过:info = os.system("curl --head www.google.com")
但info
只是0
。
“子进程模块为产生新进程和检索其结果提供了更强大的功能;使用该模块比使用此函数更可取,请参阅Replac使用子过程文档中的子流程模块部分的旧功能以获得一些有用的配方。“ -http://docs.python.org/library/os.html#os.system – 2012-04-15 01:02:21