为查找URL创建一个简单的正则表达式,然后用另一个脚本来查看该站点是否发回数据会更容易吗?我一直在想,如果这是一个更快,更容易的解决方案,而不是花几年的时间来开发“完美”的URL检测正则表达式,只是为了让它在几天后崩溃。URL正则表达式匹配器(Idea)
如果任何人都可以找到基本页面访问/加载的速度测试,请在此处发帖以帮助回答我的问题。
此外,在服务器上不断发出这样的请求,比如每小时100次,有多难?
我要测试一下Javascript,使用/(http|www\.)\S+/gim
作为正则表达式和60秒超时连接到请求的url。我会从网址做一个简单的“Title Grab”,然后记录试用期限。一旦我把它们全部想象出来,我就会发布速度。
这实在是没有太大的问题了,所以如果你发现任何真正帮助我与我的上述思想,你可能会收到自鸣得意回答对号这个“问题。
这取决于你打算找多少网址,你是多久愿意等待来自远程Web服务器的响应(可能是向上或向下,或慢,或坠毁,或其他...) – 2012-03-14 21:40:27
一个完全有效的网址可以给404一个看似无效的网址可能是正确的:[http://en.wikipedia.org/wiki///](http:/ /en.wikipedia.org/wiki///) - “有效”和“给404”有很大区别。 – Kobi 2012-03-14 21:55:25
@GregHewgill你可以使用超时检查器轻松修复这些问题。 @Kobi如果你使用了一个简单的正则表达式,比如'/(http \:\/\/| www \。)\ S +/gim',你不应该有这些问题。 – Tgwizman 2012-03-14 22:08:31