我使用这个正则表达式过滤从网页.pdffiles:正则表达式过滤链接
$regex='|<a.*?href="(.*pdf?)"|';
它的工作,如果该链接是这样的:
www.xyz.com/trgrrtr/ghtty.pdf
但如果链接是这样的,它是无法过滤:
www.xyz.com/trgrrtr/ghtty.pdf?code=KksRHhdVXAoECBFCVFpeXBsBUgYMDQpxd3J2d3F2fDtzfnFuLiErNXNpIG5kYm16aGhpcmxoa05QV1VKUVFFUxQ%3D
什么正则表达式我应该用来过滤掉这个l从网页上的墨水?
@ m-buettner您的代码正在删除域名。例如它只显示/fjfrkr/fgfj.pdf不是域名 – raju
@PayalMalhotra对不起,但我不能重现这一点。你能显示你的输入字符串的相关部分吗? –
@PayalMalhotra似乎没事,但我真的是指你的**输入字符串**而不是你的代码;) –