我刮一个网站,并得到这个:正则表达式从网页刮取某个子字符串?
<input type="BUTTON" value="Geographic Footprint" name="GEO_FOOTPRINT" onclick="return OpenModalDialog('https://mspfast.elavon.com/Symphony/client/client.do?uid=0XrHleUX5MudUYVwwsGDYCl&novaid=5418812&readonly=Y&context=BOARDING&defaultRoute=GeographicFootprint')">
我想是刚刚抢UID:0XrHleUX5MudUYVwwsGDYCl
我很新的正则表达式和并不真正了解它是如何工作的。
我试着这样做:
'/value="Geographic Footprint" name="GEO_FOOTPRINT" onclick="return OpenModalDialog(\'https://mspfast.elavon.com/Symphony/client/client.do?uid=([a-zA-Z0-9]+)\&/'
为正则表达式,但它不工作。我得到的unknown modifier '/'
“我对于正则表达式很陌生,并不真正理解它是如何工作的”,但是您正在尝试使用它来代替使用HTMl解析器? – PeeHaa
@PeeHaa如果有人不熟悉正则表达式,你认为他们会知道何时使用它或HTML解析器(他们毫无疑问不熟悉)? –
你忘了逃避URL中的'/'......你应该在尝试使用它们同时解析html **和** javascript之前,更多地学习正则表达式。 –