我试图制作一个表达式来搜索how2bypass.co.cc这样的页面,并返回“form”标签中“action”属性的内容,以及内容任何输入标签中的“名称”和“类型”属性。我无法使用html解析器,因为我的最终目标是自动检测给定页面是否是Web代理,并且一旦网站发现我正在做这些事情,他们可能会开始做一些愚蠢的事情,比如编写整个JavaScript文件阻止我解析它。在php中使用正则表达式匹配html属性
我正在使用的代码
preg_match_all('/<form.*action\="(.*?)".*>[^<]*<input.*type\=/i', $pageContents, $inputMatches);
这为action属性工作正常,但一旦我把“后键入\ =代码停止工作。这是为什么?它工作正常一次,但不是两次
谢谢,我没有意识到。*会这样做。但是,我原来的问题依然存在。把报价打破表达,我不明白为什么。 澄清:为什么 \t /