import re
import urllib.request
file_txt = urllib.request.urlopen("ftp://ftp.sec.gov/edgar/data/1408597/0000930413-12-003922.txt")
pattern_item4= re.compile("(Item\\n*\s*4.*)Item\\n*\s*5")
print(re.search(pattern_item4,bytes.decode(f)))
#Returns None
这个正则表达式返回我想要的ruby中的内容,但显然它并没有做到Python中预期的那样。任何人都可以帮助我驯服这个。 正则表达式的意图是基本上提取item4和item5之间的东西。正则表达式在Rubular中传递,但不在Python中
谢谢
'\\ n *'它没有效果。它必须是:'[\ n] *'(或者'[\\ n] *'取决于你传递这个字符串)。 – Jack 2012-07-11 23:29:08
谢谢,杰克。这个窍门也行不通。我尝试了两个建议,但没有运气.. – zsljulius 2012-07-11 23:39:54
你检查了我的答案并检查了你确实在'file_txt'中有数据吗?另外'f'来自'bytes.decode(f)'? – 2012-07-11 23:40:38