对不起,我知道这可能是一个重复,但搜索'python正则表达式匹配之间'我还没有找到任何答案我的问题!两个字符串之间的字符串的正则表达式?
的文件(其中明确,是一个长期的HTML页面)我在寻找有弦的这一大堆(一个JavaScript函数中)看起来像这样:
link: '/Hidden/SidebySideGreen/dei1=1204970159862'};
link: '/Hidden/SidebySideYellow/dei1=1204970159862'};
我想提取链接(即这些字符串中引号之间的所有内容) - 例如/Hidden/SidebySideYellow/dei1=1204970159862
要得到的联系,我知道我需要开始:
re.matchall(regexp, doc_sting)
但是应该regexp
是什么?
您是否正在使用JSON? – 2010-09-28 08:57:27
看起来像JSON数据用';'而不是','给我(当我试图想象文档的其余部分时)。 Python已经集成了JSON支持。 – Residuum 2010-09-28 08:57:28
这是一个长的HTML页面,其中包含一些JavaScript – AP257 2010-09-28 09:19:24